MEDIDAS DE TENDENCIA CENTRAL MEDIA ARITMÉTICA La media aritmética es el valor obtenido en la suma de todos sus valores dividida entre el número de sumandos. Se le llama también promedio o, simplemente, media. MEDIANA La mediana es un valor de la variable que está en la mitad de los datos, una vez que éstos están ordenados de menor a mayor. Si el número de valores es impar, la Mediana corresponderá al valor central de dicho conjunto de datos MODA La moda es el dato más repetido, el valor de la variable con mayor frecuencia absoluta.
MEDIDAS DE TENDENCIA CENTRAL
EJEMPLO Se le pregunta las edades en un minimarket a 20 personas y son las siguientes: 22 19 16 13 18 15 20 14 15 16 15 16 20 13 15 18 15 13 18 15
MEDIDAS DE TENDENCIA CENTRAL Observaciones de las MEDIDAS DE TENDENCIA CENTRAL MEDIA ARITMÉTICA: Su resultado es sensible ante la presencia de valores extremos (bajos o altos). Su aplicación es aconsejable cuando los datos son bastante homogéneos. MEDIANA: Presenta el inconveniente de que en su cálculo no intervienen todas las observaciones sino únicamente las observaciones centrales. Es aconsejable su utilización cuando los datos son irregulares. MODA: Su aplicación es apropiada cuando algún valor absorbe la mayor parte de las frecuencias, esto es, la mayoría de las observaciones son iguales entre sí. Un inconveniente es que existan varios valores modales.
ESTADÍSTICA: TEMA: MEDIDAS DE DISPERSIÓN En el análisis estadístico no basta el cálculo e interpretación de tendencia central o de posición, ya que, cuando se representa toda una información con la media aritmética, puede estar distante a la realidad, pues suelen existir datos extremos inferiores y superiores a la media aritmética, los cuales, no están siendo bien representados por este parámetro.
MEDIDAS DE DISPERSIÓN Las medidas de dispersión resumen la heterogeneidad de los valores de la variable. En algunos casos, indican qué tan alejados están los valores respecto de un punto de referencia o de un eje. Para medir el grado de dispersión de una variable, se utilizan principalmente los siguientes indicadores:
MEDIDAS DE DISPERSIÓN RANGO o RECORRIDO Es la diferencia de la variable entre sus valores máximo y mínimo de los datos de una distribución estadística. Rango o Recorrido Intercuartílico (RQ) Es la diferencia entre los cuartiles mayor y menor. Con esta medida se excluyen los valores más altos y bajos, pues elimina el 25% de los valores más altos y el 25% de los valores más bajos de la distribución. Rango o Recorrido Intercuartílico Medio [(RQ)/2] Es el valor medio de la diferencia entre el mayor y menor cuartil.
MEDIDAS DE DISPERSIÓN DESVIACIÓN MEDIA La desviación media, mide la distancia absoluta promedio entre cada uno de los datos, y el parámetro que caracteriza la información. Usualmente se considera la media aritmética de los valores absolutos de las desviaciones respecto a la media. Calcular la desviación media de la distribución: 9, 3, 8, 8, 9, 8, 9, 18
MEDIDAS DE DISPERSIÓN Desviación Media para datos agrupados Donde: : Desviación media N: Número de elementos totales (suma de todas las frecuencias absolutas) k: número de clases. fi: frecuencia absoluta de cada clase, es decir, el número de elementos que pertenecen a dicha clase. xi: marca de clase. Es el punto medio del límite inferior y del límite superior. : media de la muestra.
MEDIDAS DE DISPERSIÓN Desviación Media para datos agrupados Calcular la desviación media de la distribución:
MEDIDAS DE DISPERSIÓN Calcular la desviación media de la distribución: Datos xi fi [ 10 – 15) 12,5 2 [ 15 – 20) 17,5 8 [ 20 – 25) 22,5 9 [ 25 – 30) 27,5 7 [ 30 – 35) 32,5 3
MEDIDAS DE DISPERSIÓN Calcular la desviación media de la distribución: Datos xi fi Xi*fi |xi - ẋ| |xi - ẋ|*fi [ 10 – 15) 12,5 2 25 10,17 20,34 [ 15 – 20) 17,5 8 140 5,17 41,36 [ 20 – 25) 22,5 9 202,5 0,17 1,53 [ 25 – 30) 27,5 7 192,5 4,83 33,81 [ 30 – 35) 32,5 3 97,5 9,83 29,49 29 657,5 126,53
MEDIDAS DE DISPERSIÓN VARIANZA Es otro parámetro utilizado para medir la dispersión de los valores de una variable respecto a la media. Corresponde a la media aritmética de los cuadrados de las desviaciones respecto a la media. Calcular la varianza de la distribución: 9, 3, 8, 8, 9, 8, 9, 18
MEDIDAS DE DISPERSIÓN Varianza para datos agrupados El problema de los signos en la desviación media, es eludido elevando las diferencias al cuadrado. La varianza es uno de los parámetros más importantes, pues teniendo conocimiento de la varianza de una población, se ha avanzado en el conocimiento de la población misma. La variancia sesgada o varianza poblacional , refleja a la perfección el significado de una medida de dispersión como un promedio de los cuadrados de las desviaciones y tiene una gran aplicación en el estudio de las probabilidades. Se define la varianza, como desviación cuadrática media de los datos con respecto a la media aritmética.
MEDIDAS DE DISPERSIÓN Varianza para datos agrupados La variancia insesgada , varianza muestral o cuasivarianza , es más propicia en los cálculos estadísticos y se usa en las muestras. Cuando el tamaño de la muestra es grande, (n – 1) será aproximadamente igual a n, por lo que este denominador tiene un impacto real en el cálculo de la varianza para muestras pequeñas. Las fórmulas de la varianza poblacional y la varianza de la muestra son ligeramente diferentes
MEDIDAS DE DISPERSIÓN Propiedades de la Varianza La varianza será siempre un valor positivo, o cero en el caso que las puntuaciones sean iguales. La varianza, al igual que la media, es un índice muy sensible a las puntuaciones extremas. La varianza no viene expresada en las mismas unidades que los datos, ya que las desviaciones están elevadas al cuadrado.
MEDIDAS DE DISPERSIÓN DESVIACIÓN TÍPICA O ESTÁNDAR Para una mejor comprensión se debe recurrir a la desviación típica o estándar, definida como la raíz cuadrada de la varianza. La desviación estándar mide el grado de dispersión de los datos con respecto a la media, se denota como s para una muestra o como σ para la población.
MEDIDAS DE DISPERSIÓN Calcular la varianza y la desviación estándar de acuerdo con la tabla de datos agrupados
MEDIDAS DE DISPERSIÓN Calcular la varianza y la desviación estándar de acuerdo con la tabla de datos agrupados Datos xi fi [ 10 – 15) 12,5 3 [ 15 – 20) 17,5 5 [ 20 – 25) 22,5 7 [ 25 – 30) 27,5 8 [ 30 – 35) 32,5 4
MEDIDAS DE DISPERSIÓN COEFICIENTE DE VARIABILIDAD Generalmente interesa establecer comparaciones de la dispersión, entre diferentes muestras que posean distintas magnitudes o unidades de medida. El coeficiente de variabilidad tiene en cuenta el valor de la media aritmética, para establecer un número relativo, que hace comparable el grado de dispersión entre dos o más variables. El coeficiente de variación permite comparar las dispersiones de dos distribuciones distintas, siempre que sus medidas sean positivas. Se calcula para cada una de las distribuciones y los valores que se obtienen se comparan entre sí. La mayor dispersión corresponderá al valor del coeficiente de variación mayor.
MEDIDAS DE DISPERSIÓN Una distribución tiene x = 140 y s = 28,28 y otra x = 150 y s = 24. ¿Cuál de las dos distribuciones presenta mayor dispersión?. En una distribución discreta se tiene los siguientes valores: –10, 3, x, 10, 1, 0. Si la desviación típica es igual al coeficiente de variación, calcular el valor desconocido de x.
EJEMPLO 1 Número de veces que han ido al cine en el último mes los alumnos de una clase 2 3 0 1 5 3 2 3 0 0 2 1 2 1 0 2 1 1 1 3 4 0 0 2 1
EJEMPLO 2 En un centro comercial se preguntan las edades a 20 personas y se registran las siguientes: 22 19 16 21 18 15 20 20 15 16 15 16 20 21 15 18 15 21 18 15
EJEMPLO 3 Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas, realizar la tabla de frecuencia para dichos valores, el histograma y el polígono de frecuencia. 32 31 28 29 33 32 31 30 31 31 27 28 29 30 32 31 31 30 30 29 29 30 30 31 30 31 34 33 33 29 29
EJEMPLO 4 Calcular la media, la mediana y la moda de los siguientes datos : 5 3 6 5 4 5 2 8 6 5 4 8 3 4 5 4 8 2 5 4
EJEMPLO 5 Concentraciones de calcio de 40 análisis de agua:
EJEMPLO 6 Se pregunta a 30 personas su peso y se obtienen los siguientes datos 58 50 56 56 58 58 56 63 50 63 68 63 64 64 53 60 68 65 63 61 55 65 56 63 52 57 60 59 58 64
EJEMPLO 7 Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas, realizar la tabla de frecuencia para dichos valores, el histograma y el polígono de frecuencia. 32 31 28 29 33 32 31 30 31 31 27 28 29 30 32 31 31 30 30 29 29 30 30 31 30 31 34 33 33 29 29