Medidas de TC, Dispersion, Posición , simetria y apuntamiento.pptx
jsalvarezcamacho
0 views
48 slides
Sep 28, 2025
Slide 1 of 48
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
About This Presentation
Análisis de datos cualitativo
Size: 7.12 MB
Language: es
Added: Sep 28, 2025
Slides: 48 pages
Slide Content
ANALISIS DE DATOS CUALITATIVOS
FRECUENCIA Frecuencia absoluta Conteo del número de veces que se observa una característica ID Sexo 01 M 02 M 03 M 04 F 05 M 06 F 07 F 08 M 09 F 10 M 11 M 12 M 13 M 14 M 15 F 16 M 17 M 18 F 19 F 20 M 21 F 22 F 22 M 24 F
FRECUENCIA Frecuencia relativa Resultado de dividir la frecuencia absoluta entre el total de datos Ejemplo: #mujeres______________ Total de observaciones ID Sexo 01 M 02 M 03 M 04 F 05 M 06 F 07 F 08 M 09 F 10 M 11 M 12 M 13 M 14 M 15 F 16 M 17 M 18 F 19 F 20 M 21 F 22 F 22 M 24 F
FRECUENCIA Tabla de frecuencias ID Escolaridad 01 P 02 P 03 S 04 S 05 P 06 S 07 S 08 U 09 U 10 U 11 S 12 S 13 P 14 U 15 U 16 U 17 U 18 U 19 U 20 T 21 T 22 T 22 U 24 U Escolaridad Frecuencia Frecuencia Relativa Frecuencia Acumulada Frecuencia relativa acumulada
ANALISIS DE DATOS CUANTITATIVOS
Tabla de Frecuencia para variables cuantitativas
En este ejemplo nos dan el número de clases o intervalo (k)
Regla de Sturges La regla de Sturges, propuesta por Herbert Sturges en 1926, es una regla práctica acerca de como calcular el número de clases o intervalos de una tabla de frecuencia de datos agrupados (cuando no nos dan el k). Este número viene dado por la siguiente expresión: N: cantidad de datos El valor de k (número de clases o intervalos) es común redondearlo al entero más cercano.
Hemoglobinas (mg/dl) de una muestra de 10 recién nacidos: 14 12 18 13 15 16 16 14 16 20
Tabla de frecuencia variables cuantitativas
Tabla de frecuencia variables cuantitativas
Diagrama de tallo y hoja Se requiere que los datos estén conformados por al menos dos dígitos. El último dígito constituye la hoja y el ó los restantes conformarán el tallo. Para una adecuada descripción de los datos es conveniente trabajar con al menos 4 tallos IMC, grupo de pacientes Diabéticos
ESTADISTICA DESCRIPTIVA -Medidas ú tiles para analizar e interpretar datos cuantitativos , organizados de forma agrupada o no agrupada. -Son valores que definen el comportamiento de la distribuci ó n de los datos -Se dividen en dos tipos: Tendencia Central Dispersi ó n y de Simetr í a
La caracter í stica m á s importante que describe o resume un grupo de datos es su posici ó n . MEDIDAS DE TENDENCIA CENTRAL
Los conjuntos de datos muestran una tendencia definida a agruparse o resumirse en torno a cierto punto , por lo que, para cualquier conjunto particular de datos, es posible seleccionar un valor t í pico para describir, representar o resumir todo el conjunto de datos. MEDIDAS DE TENDENCIA CENTRAL
Se usan para indicar un valor que tiende a tipificar o a ser el m á s representativo de un conjunto de datos. Las tres medidas que m á s com ú nmente se emplean son las siguientes: Media aritm é tica Mediana Moda Medidas de tendencia central
Media Aritmética
Tendencia central de la distribución por edad Número de casos Edad (años) A? B? Dis p ers ión
M oda : p ropiedades/ u sos "¿Cuál es el grupo más común?“ La medida más sencilla de la ubicación central para comprender, explicar e identificar. Puede haber más de una moda. Puede que no haya moda. La moda puede no ser "central“.
MODA El valor que más se repite es 6 , 10 y 11; luego entonces es TRIMODAL Se tiene el número de hijos en 17 parejas de matrimonios: 2 , 2 , 4 , 1 , 3 , 5 , 3 , 2 , 1 , 6 , 3, 4 , 1 , 2 , 0 , 2 , 3 La frecuencia que más se repite es 2, por lo tanto esa es la moda Obs. Días 1 3 2 6 3 7 4 7 5 8 6 8 7 8 8 8 9 9 10 9 11 9 12 9 13 9 14 10 15 10 16 1 1 17 13 18 1 6 19 1 7
MODA
Identificar la moda de un histograma M oda = valor más frecuente M oda = 9 días
Mediana
Mediana Definición: Valor medio; valor que divide la distribución en dos partes iguales El 50% de las observaciones son iguales o están por debajo de la mediana . El 50% de las observaciones son iguales o están por encima de la mediana . Para calcular la mediana, siga estos pasos: Organice las observaciones en orden Encuentre la posición media como (n + 1) / 2 Identifique el valor en el medio
Mediana : p ropiedades/ u sos Buena medida descriptiva . Medida de elección para los datos que no están distribuidos simétricamente . Se enfoca en el centro de los datos, así que no está afectada por algunos valores extremos (atípicos) .
MEDIA DATOS AGRUPADOS Edad en grupo Frec. absoluta Punto medio clase Punto medio x frecuencia 25-37 6 31 186 38-50 7 44 308 51-63 5 57 285 Total 18 779 Cálculo del promedio= 779/ 18=43.28
Edad en grupo Frec. absoluta Punto medio clase Punto medio x frecuencia 5-7 6 8-10 7 11-12 5 Total 18
SERIE AGRUPADA : MEDIANA Mediana: Me L i + A F(i-1) i Li = Límite inferior del intervalo donde la frecuencia acumulada incluye la posición de la mediana i = amplitud de clase: límite superior - límite inferior del intervalo = posición de la mediana F (i-1) = Frecuencia acumulada del valor anterior al intervalo donde cae la mediana. i = f recuencia absoluta del intervalo donde cae la mediana
SERIE AGRUPADA : MEDIANA Tiempo de Espera Número de personas f i Frecuencia acumulada F Porcentaje acumulado % 20 – 24 25 – 29 30 – 34 35 – 39 40 – 44 45 – 49 50 – 54 Total 4 8 9 10 7 6 6 50 4 12 21 31 38 44 50 8 24 42 62 76 88 100 Me = 35 + [4 (50/2 – 21)/10] = 36.6 Distribución de tiempo de espera para realización de espirometrias en trabajadores de alto riesgo y mediano riesgo en Empresa X. Barrancabermeja I trimestre 2009
Resumen: Medidas de tendencia central Medida de tendencia central: medida única que representa toda una distribución . Moda: valor más común . Mediana: valor central , es la opción más segura Media: valor promedio . U sa todos los datos, sensible a valores atípicos . P referida para datos simétricos, que no es común .
MEDIDAS DE DISPERSIÓN Miden la variabilidad de los datos con respecto a la media
34 Coeficiente de variación Es la razón entre la desviación típica y la media. Mide la desviación típica en forma de “ qué tamaño tiene con respecto a la media ” También se la denomina variabilidad relativa . Es frecuente mostrarla en porcentajes Si la media es 80 y la desviación típica 20 entonces CV=20/80=0,25=25% (variabilidad relativa)
35 Coeficiente de variación Es una cantidad adimensional . Interesante para comparar la variabilidad de diferentes variables. Si el peso tiene CV=30% y la altura tiene CV=10%, los individuos presentan más dispersión en peso que en altura. No debe usarse cuando la variable presenta valores negativos o donde el valor 0 sea una cantidad fijada arbitrariamente Por ejemplo 0ºC ≠ 0ºF
Ejemplo Un investigador desea comparar el nivel de dispersión de una serie de datos de la altura de los trabajadores de una empresa y otra serie con el peso de dichos trabajadores, no se puede utilizar las desviaciones típicas (una viene expresada en cm y la otra en kg). Por lo tanto debe utilizar, sus coeficientes de variación en porcentajes, para realizar la comparación.
Procedimiento Peso = 60.5 Kg. D.S= 4.05 Kg. Altura= 172 cms. D.S= 9.5 cms. ¿En cual hay mayor variabilidad de los datos?
Medidas de Posición: Cuartiles y Percentiles Cuartiles : distribuyen la serie de datos en cuatro partes, el primer cuartil corresponde al 25%, el segundo cuartil corresponde a la mediana (P50 = Me) y el cuartil 3, corresponde al 75% de los datos. Cálculo: P25 o Q 1 = n /4 ó 0.25(n+1) P50 o Me ó Q 2 = 0.50(n+1) P75 o Q 3 = 0.75 (n + 1 ) ó 3 (n + 1) / 4
Si la Media, Moda y Mediana son iguales, esto es, Media = Mediana = Moda se dice que los datos se distribuyen sim é tricamente. CURVAS SIMÉTRICAS O NORMALES
Moda < Mediana < Media en este caso la mayoría de las observaciones se encuentran por debajo de la Media. SESGADA HACIA LA DERECHA Curva sesgada a la derecha o con sesgo positivo:
Media < Mediana < Moda en este caso la mayoría de las observaciones se encuentran por arriba de la Media. SESGADA A LA IZQUIERDA Curva sesgada a la izquierda o con sesgo negativo: