Medidas de TC, Dispersion, Posición , simetria y apuntamiento.pptx

jsalvarezcamacho 0 views 48 slides Sep 28, 2025
Slide 1
Slide 1 of 48
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10
Slide 11
11
Slide 12
12
Slide 13
13
Slide 14
14
Slide 15
15
Slide 16
16
Slide 17
17
Slide 18
18
Slide 19
19
Slide 20
20
Slide 21
21
Slide 22
22
Slide 23
23
Slide 24
24
Slide 25
25
Slide 26
26
Slide 27
27
Slide 28
28
Slide 29
29
Slide 30
30
Slide 31
31
Slide 32
32
Slide 33
33
Slide 34
34
Slide 35
35
Slide 36
36
Slide 37
37
Slide 38
38
Slide 39
39
Slide 40
40
Slide 41
41
Slide 42
42
Slide 43
43
Slide 44
44
Slide 45
45
Slide 46
46
Slide 47
47
Slide 48
48

About This Presentation

Análisis de datos cualitativo


Slide Content

ANALISIS DE DATOS CUALITATIVOS

FRECUENCIA Frecuencia absoluta Conteo del número de veces que se observa una característica ID Sexo 01 M 02 M 03 M 04 F 05 M 06 F 07 F 08 M 09 F 10 M 11 M 12 M 13 M 14 M 15 F 16 M 17 M 18 F 19 F 20 M 21 F 22 F 22 M 24 F

FRECUENCIA Frecuencia relativa Resultado de dividir la frecuencia absoluta entre el total de datos Ejemplo: #mujeres______________ Total de observaciones ID Sexo 01 M 02 M 03 M 04 F 05 M 06 F 07 F 08 M 09 F 10 M 11 M 12 M 13 M 14 M 15 F 16 M 17 M 18 F 19 F 20 M 21 F 22 F 22 M 24 F

FRECUENCIA Tabla de frecuencias ID Escolaridad 01 P 02 P 03 S 04 S 05 P 06 S 07 S 08 U 09 U 10 U 11 S 12 S 13 P 14 U 15 U 16 U 17 U 18 U 19 U 20 T 21 T 22 T 22 U 24 U Escolaridad Frecuencia Frecuencia Relativa Frecuencia Acumulada Frecuencia relativa acumulada

ANALISIS DE DATOS CUANTITATIVOS

Tabla de Frecuencia para variables cuantitativas

En este ejemplo nos dan el número de clases o intervalo (k)

Regla de Sturges La regla de Sturges, propuesta por Herbert Sturges en 1926, es una regla práctica acerca de como calcular el número de clases o intervalos de una tabla de frecuencia de datos agrupados (cuando no nos dan el k). Este número viene dado por la siguiente expresión:   N: cantidad de datos El valor de k (número de clases o intervalos) es común redondearlo al entero más cercano.

Hemoglobinas (mg/dl) de una muestra de 10 recién nacidos: 14 12 18 13 15 16 16 14 16 20

Tabla de frecuencia variables cuantitativas

Tabla de frecuencia variables cuantitativas

Diagrama de tallo y hoja Se requiere que los datos estén conformados por al menos dos dígitos. El último dígito constituye la hoja y el ó los restantes conformarán el tallo. Para una adecuada descripción de los datos es conveniente trabajar con al menos 4 tallos IMC, grupo de pacientes Diabéticos

ESTADISTICA DESCRIPTIVA -Medidas ú tiles para analizar e interpretar datos cuantitativos , organizados de forma agrupada o no agrupada. -Son valores que definen el comportamiento de la distribuci ó n de los datos -Se dividen en dos tipos: Tendencia Central Dispersi ó n y de Simetr í a

La caracter í stica m á s importante que describe o resume un grupo de datos es su posici ó n . MEDIDAS DE TENDENCIA CENTRAL

Los conjuntos de datos muestran una tendencia definida a agruparse o resumirse en torno a cierto punto , por lo que, para cualquier conjunto particular de datos, es posible seleccionar un valor t í pico para describir, representar o resumir todo el conjunto de datos. MEDIDAS DE TENDENCIA CENTRAL

Se usan para indicar un valor que tiende a tipificar o a ser el m á s representativo de un conjunto de datos. Las tres medidas que m á s com ú nmente se emplean son las siguientes: Media aritm é tica Mediana Moda Medidas de tendencia central

Media Aritmética

Tendencia central de la distribución por edad Número de casos Edad (años) A? B? Dis p ers ión

M oda : p ropiedades/ u sos "¿Cuál es el grupo más común?“ La medida más sencilla de la ubicación central para comprender, explicar e identificar. Puede haber más de una moda. Puede que no haya moda. La moda puede no ser "central“.

MODA El valor que más se repite es 6 , 10 y 11; luego entonces es TRIMODAL Se tiene el número de hijos en 17 parejas de matrimonios: 2 , 2 , 4 , 1 , 3 , 5 , 3 , 2 , 1 , 6 , 3, 4 , 1 , 2 , 0 , 2 , 3 La frecuencia que más se repite es 2, por lo tanto esa es la moda Obs. Días 1 3 2 6 3 7 4 7 5 8 6 8 7 8 8 8 9 9 10 9 11 9 12 9 13 9 14 10 15 10 16 1 1 17 13 18 1 6 19 1 7

MODA

Identificar la moda de un histograma M oda = valor más frecuente M oda = 9 días

Mediana

Mediana Definición: Valor medio; valor que divide la distribución en dos partes iguales El 50% de las observaciones son iguales o están por debajo de la mediana . El 50% de las observaciones son iguales o están por encima de la mediana . Para calcular la mediana, siga estos pasos: Organice las observaciones en orden Encuentre la posición media como (n + 1) / 2 Identifique el valor en el medio

Mediana : p ropiedades/ u sos Buena medida descriptiva . Medida de elección para los datos que no están distribuidos simétricamente . Se enfoca en el centro de los datos, así que no está afectada por algunos valores extremos (atípicos) .

MEDIA DATOS AGRUPADOS Edad en grupo Frec. absoluta Punto medio clase Punto medio x frecuencia 25-37 6 31 186 38-50 7 44 308 51-63 5 57 285 Total 18 779 Cálculo del promedio= 779/ 18=43.28

Edad en grupo Frec. absoluta Punto medio clase Punto medio x frecuencia 5-7 6 8-10 7 11-12 5 Total 18

SERIE AGRUPADA : MEDIANA Mediana: Me  L i + A   F(i-1) i Li = Límite inferior del intervalo donde la frecuencia acumulada incluye la posición de la mediana i = amplitud de clase: límite superior - límite inferior del intervalo   = posición de la mediana F (i-1) = Frecuencia acumulada del valor anterior al intervalo donde cae la mediana. i = f recuencia absoluta del intervalo donde cae la mediana

SERIE AGRUPADA : MEDIANA Tiempo de Espera Número de personas f i Frecuencia acumulada F Porcentaje acumulado % 20 – 24 25 – 29 30 – 34 35 – 39 40 – 44 45 – 49 50 – 54 Total 4 8 9 10 7 6 6 50 4 12 21 31 38 44 50 8 24 42 62 76 88 100 Me = 35 + [4 (50/2 – 21)/10] = 36.6 Distribución de tiempo de espera para realización de espirometrias en trabajadores de alto riesgo y mediano riesgo en Empresa X. Barrancabermeja I trimestre 2009

Resumen: Medidas de tendencia central Medida de tendencia central: medida única que representa toda una distribución . Moda: valor más común . Mediana: valor central , es la opción más segura Media: valor promedio . U sa todos los datos, sensible a valores atípicos . P referida para datos simétricos, que no es común .

MEDIDAS DE DISPERSIÓN Miden la variabilidad de los datos con respecto a la media

34 Coeficiente de variación Es la razón entre la desviación típica y la media. Mide la desviación típica en forma de “ qué tamaño tiene con respecto a la media ” También se la denomina variabilidad relativa . Es frecuente mostrarla en porcentajes Si la media es 80 y la desviación típica 20 entonces CV=20/80=0,25=25% (variabilidad relativa)  

35 Coeficiente de variación Es una cantidad adimensional . Interesante para comparar la variabilidad de diferentes variables. Si el peso tiene CV=30% y la altura tiene CV=10%, los individuos presentan más dispersión en peso que en altura. No debe usarse cuando la variable presenta valores negativos o donde el valor 0 sea una cantidad fijada arbitrariamente Por ejemplo 0ºC ≠ 0ºF  

Ejemplo Un investigador desea comparar el nivel de dispersión de una serie de datos de la altura de los trabajadores de una empresa y otra serie con el peso de dichos trabajadores, no se puede utilizar las desviaciones típicas (una viene expresada en cm y la otra en kg). Por lo tanto debe utilizar, sus coeficientes de variación en porcentajes, para realizar la comparación.

Procedimiento Peso = 60.5 Kg. D.S= 4.05 Kg. Altura= 172 cms. D.S= 9.5 cms. ¿En cual hay mayor variabilidad de los datos?

Medidas de Posición: Cuartiles y Percentiles Cuartiles : distribuyen la serie de datos en cuatro partes, el primer cuartil corresponde al 25%, el segundo cuartil corresponde a la mediana (P50 = Me) y el cuartil 3, corresponde al 75% de los datos. Cálculo: P25 o Q 1 = n /4 ó 0.25(n+1) P50 o Me ó Q 2 = 0.50(n+1) P75 o Q 3 = 0.75 (n + 1 ) ó 3 (n + 1) / 4

Si la Media, Moda y Mediana son iguales, esto es, Media = Mediana = Moda se dice que los datos se distribuyen sim é tricamente. CURVAS SIMÉTRICAS O NORMALES

Moda < Mediana < Media en este caso la mayoría de las observaciones se encuentran por debajo de la Media. SESGADA HACIA LA DERECHA Curva sesgada a la derecha o con sesgo positivo:

Media < Mediana < Moda en este caso la mayoría de las observaciones se encuentran por arriba de la Media. SESGADA A LA IZQUIERDA Curva sesgada a la izquierda o con sesgo negativo:

Coeficiente de asimetría y curtosis

Coeficiente de apuntamiento
Tags