Datos agrupados y no agrupados

116,732 views 19 slides Sep 30, 2015
Slide 1
Slide 1 of 19
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10
Slide 11
11
Slide 12
12
Slide 13
13
Slide 14
14
Slide 15
15
Slide 16
16
Slide 17
17
Slide 18
18
Slide 19
19

About This Presentation

Explica la diferencia entre datos agrupados y no Agrupados.


Slide Content

Datos agrupados y no agrupados PROBABILIDAD Y ESTADÍSTICA 1 UVEDL-ING. RENATA BRISEÑO

Estadística Descriptiva Una de las ramas de la Estadística más accesible a la mayoría de la población es la descriptiva. Esta parte se dedica única y exclusivamente al ordenamiento y tratamiento mecánico de la información para su presentación por medio de tablas y de representaciones gráficas, así como de la obtención de algunos parámetros útiles para la explicación de la información. UVEDL-ING. RENATA BRISEÑO 2

Descripción de datos: Cuando la muestra que se ha tomado de la población o proceso que se desea analizar, es decir, tenemos menos de 20 elementos en la muestra, entonces estos datos son analizados sin necesidad de formar clases con ellos y a esto es a lo que se le llama tratamiento de datos no agrupados. Cuando la muestra consta de 20 o más datos, lo aconsejable es agrupar los datos en clases y a partir de estas determinar las características de la muestra y por consiguiente las de la población de donde fue tomada. UVEDL-ING. RENATA BRISEÑO 3

DATOS AGRUPADOS Distribución de frecuencia de clase o de datos Agrupados (n>20): Es aquella distribución en la que la disposición tabular de los datos estadísticos se encuentran ordenados en clases y con la frecuencia de cada clase; es decir, los datos originales de varios valores adyacentes del conjunto se combinan para formar un intervalo de clase. UVEDL-ING. RENATA BRISEÑO 4

Datos no agrupados:   Distribución de frecuencia para datos no Agrupados (n<20): Es aquella distribución que indica las frecuencias con que aparecen los datos estadísticos, desde el menor de ellos hasta el mayor de ese conjunto sin que se haya hecho ninguna modificación al tamaño de las unidades originales. En estas distribuciones cada dato mantiene su propia identidad después que la distribución de frecuencia se ha elaborado. En estas distribuciones los valores de cada variable han sido solamente reagrupados, siguiendo un orden lógico con sus respectivas frecuencias.   Nota: No existen normas establecidas para determinar cuándo es apropiado utilizar datos agrupados o datos no agrupados; sin embargo, se sugiere que cuando el número total de datos (N) es igual o superior a 20, se utilizará la distribución de frecuencia para datos agrupados, también se utilizará este tipo de distribución cuando se requiera elaborar gráficos lineales como el histograma, el polígono de frecuencia o la ojiva. La razón fundamental para utilizar la distribución de frecuencia de clases es proporcionar mejor comunicación acerca del patrón establecido en los datos y facilitar la manipulación de los mismos. Los datos se agrupan en clases con el fin de sintetizar, resumir, condensar o hacer que la información obtenida de una investigación sea manejable con mayor facilidad. UVEDL-ING. RENATA BRISEÑO 5

DATOS NO AGRUPADOS Tendencia central: la tendencia central se refiere al punto medio de una distribución. Las medidas de tendencia central se conocen como medidas de posición.   Dispersión: se refiere a la extensión de los datos en una distribución, es decir, al grado en que las observaciones se distribuyen. UVEDL-ING. RENATA BRISEÑO 6

DATOS AGRUPADOS Conjunto de observaciones que se presentan en su forma original tal y como fueron recolectados, para obtener información directamente de ellos. Medidas de Dispersión, Se llaman medidas de dispersión aquellas que permiten retratar la distancia de los valores de la variable a un cierto valor central, o que permiten identificar la concentración de los datos en un cierto sector del recorrido de la variable. Se trata de coeficiente para variables cuantitativas.   Medidas de Tendencia central, La estadística busca entre otras cosas, describir las características típicas de conjuntos de datos y, como hay varias formas de hacerlo, existen y se utilizan varios tipos de promedios. Se les llama medidas de tendencia central porque generalmente la acumulación más alta de datos se encuentra en los valores intermedios. UVEDL-ING. RENATA BRISEÑO 7

Las medidas de tendencia central comúnmente empleadas son: Media aritmética Media geométrica Mediana Media armónica Moda Los cuánticos UVEDL-ING. RENATA BRISEÑO 8

PARA LOS AGRUPADOS histograma : Está formado por rectángulos cuya base es la amplitud del intervalo y tiene la característica que la superficie que corresponde a las barras es representativa de la cantidad de casos o frecuencia de cada tramo de valores, puede construirse con clases que tienen el mismo tamaño o diferente (intervalo variable). La utilización de los intervalos de amplitud variable se recomienda cuando en alguno de los intervalos, de amplitud constante, se presente la frecuencia cero o la frecuencia de alguno o algunos de los intervalos sean mucho mayores que la de los demás, logrando así que las observaciones se hallen mejor repartidas dentro del intervalo. UVEDL-ING. RENATA BRISEÑO 9

OJIVAS Cuando se trata de relacionar observaciones en un mismo aspecto para dos colectivos diferentes no es posible ejecutar comparaciones sobre la base de la frecuencia, es necesario tener una base estándar, la frecuencia relativa. La ojiva representa gráficamente la forma en que se acumulan los datos y permiten ver cuántas observaciones se hallan por arriba o debajo de ciertos valores. Es útil para obtener una medida de los cuartiles, deciles , percentiles. UVEDL-ING. RENATA BRISEÑO 10

POLIGONOS DE FRECUENCIAS Se puede obtener uniendo cada punto medio (marca de clase) de los rectángulos del histograma con líneas rectas, teniendo cuidado de agregar al inicio y al final marcas de clase adicionales, con el objeto de asegurar la igualdad del áreas.   UVEDL-ING. RENATA BRISEÑO 11

DIAGRAMAS DE BARRAS: Son similares a los gráficos de sectores. Se representan tantas barras como categorías tiene la variable, de modo que la altura de cada una de ellas sea proporcional a la frecuencia o porcentaje de casos en cada clase. Estos mismos gráficos pueden utilizarse también para describir variables numéricas discretas que toman pocos valores. UVEDL-ING. RENATA BRISEÑO 12

EN LOS GRÁFICOS DE SECTORES: También conocidos como diagramas de "tartas", se divide un círculo en tantas porciones como clases tenga la variable, de modo que a cada clase le corresponde un arco de círculo proporcional a su frecuencia absoluta o relativa. Un ejemplo se muestra en la. Como se puede observar, la información que se debe mostrar en cada sector hace referencia al número de casos dentro de cada categoría y al porcentaje del total que estos representan.   Si el número de categorías es excesivamente grande, la imagen proporcionada por el gráfico de sectores no es lo suficientemente clara y por lo tanto la situación ideal es cuando hay alrededor de tres categorías. En este caso se pueden apreciar con claridad dichos subgrupos. UVEDL-ING. RENATA BRISEÑO 13

EJEMPLOS: Datos agrupados y no agrupados o series agrupadas y no agrupadas (que es lo mismo) se refiere al hecho de que estén ordenados, clasificados y contados, por ejemplo: Vas a investigar la edad a un grupo de 20 Niños en datos no agrupados (es decir, vienen los 20 niños y así como te dan la edad así la anotas   2,2,1,3,3,3,4,4,5,6,1,2,2,3,3,3,4,4,3,… (Total 20 niños) Estos son datos no agrupados por qué no los has clasificado y contado   1,1,2,2,2,2,3,3,3,3,3,3,3,4,4,4,4,5,5,… (Total 20 niños)   Los datos no agrupados también los puedes ordenar, por ejemplo de la edad menor a la edad mayor, no están contabilizados ni clasificados solamente están ordenados UVEDL-ING. RENATA BRISEÑO 14

Para que sean datos agrupados tienes que contarlos y clasificarlos, por ejemplo cuántos niños había de cada año. (Y siguen siendo 20 niños) Edad....Frecuencia 1..................2 2..................4 3..................7 4..................4 5..................2 6..................1 Total............20   O también los puedes agrupar (Serie agrupada) en clases, rangos, grupos o intervalos por ejemplo de 2 años para este caso (y siguen siendo 20)   Edad..........Frecuencia 1-2...............6 3-4...............11 5-6...............3 Total.............20   Es decir, fíjate bien, son datos agrupados cuando tienen FRECUENCIA (quiere decir que están contados y clasificados y DATOS NO AGRUPADOS cuando no tienen frecuencia o que no estaban contabilizados o clasificados. UVEDL-ING. RENATA BRISEÑO 15

Las medidas de tendencia central (media, moda y mediana) y las Medidas de dispersión (desviación estándar, varianza, cuartiles, percentiles, entré otros se CALCULAN DIFERENTE cuando se trata de datos agrupados y de datos no agrupados UVEDL-ING. RENATA BRISEÑO 16

  Datos no agrupados. Cuando la muestra que se ha tomado de la población o proceso que se desea analizar, es decir, tenemos menos de 20 elementos en la muestra, entonces estos datos son analizados sin necesidad de formar clases con ellos y a esto es a lo que se le llama tratamiento de datos no agrupados.   Distribución de frecuencia para datos no Agrupados (n<20): Es aquella distribución que indica las frecuencias con que aparecen los datos estadísticos, desde el menor de ellos hasta el mayor de ese conjunto sin que se haya hecho ninguna modificación al tamaño de las unidades originales. En estas distribuciones cada dato mantiene su propia identidad después que la distribución de frecuencia se ha elaborado. En estas distribuciones los valores de cada variable han sido solamente reagrupados, siguiendo un orden lógico con sus respectivas frecuencias. UVEDL-ING. RENATA BRISEÑO 17

Vas a investigar la edad a un grupo de 20 Niños en datos no agrupados (es decir, vienen los 20 niños y así como te dan la edad así la anotas 2,2,1,3,3,3,4,4,5,6,1,2,2,3,3,3,4,4,3,… (Total 20 niños)   Estos son datos no agrupados por qué no los has clasificado y contado, también se pueden ordenar de la edad menor a mayor. Datos agrupados   Cuando la muestra consta de 20 o más datos, lo aconsejable es agrupar los datos en clases y a partir de estas determinar las características de la muestra y por consiguiente las de la población de donde fue tomada.   Distribución de frecuencia de clase o de datos Agrupados (n>20): Es aquella distribución en la que la disposición tabular de los datos estadísticos se encuentran ordenados en clases y con la frecuencia de cada clase; es decir, los datos originales de varios valores adyacentes del conjunto se combinan para formar un intervalo de clase .   UVEDL-ING. RENATA BRISEÑO 18

EJEMPLO Para que sean datos agrupados tienes que contarlos y clasificarlos, por ejemplo cuántos niños había de cada año. (y siguen siendo 20 niños)   Edad..........Frecuencia 1..................2 2..................4 3..................7 4..................4 5..................2 6..................1 Total............20   UVEDL-ING. RENATA BRISEÑO 19