DISTRIBUCION DE FRECUENCIAS La distribuci ó n de frecuencias es un resumen tabular en el que los datos se presentan en agrupamientos o categor í as convenientemente establecidas de clases ordenadas num é ricamente. En una tabla de distribuci ó n de frecuencias, de una serie de datos, se muestra el n ú mero de observaciones llamado frecuencia de determinada variable dentro de un grupo espec í fico. La tabla de distribuci ó n de frecuencias proporciona pistas acerca de las caracter í sticas de la poblaci ó n sujeta a estudio. Adem á s permite realizar c á lculos posteriores para el an á lisis de los datos. Al agrupar o condensar en tablas de distribuci ó n de frecuencias, el proceso del an á lisis e interpretaci ó n de los datos se hace mucho m á s manejable y significativo
TABLA DE DISTRIBUCION DE FRECUENCIAS La tabla de distribuci ó n de frecuencias, est á compuesta por los siguientes elementos: Rango. Nú mero de clases o intervalos. Ancho de clase o intervalo. Limites aparentes y reales. Frecuencias. Marcas de clase.
RANGO Llamado tambi é n recorrido, indica la amplitud de la ubicaci ón num é rica del conjunto de datos. Es la diferencia que existe entre el mayor y el menor de los datos: R = Dato mayor - Dato menor
B) NUMERO DE CLASES O INTERVALOS (K) El n ú mero de agrupamientos de clase a utilizar depende principalmente del n ú mero de observaciones en los datos, es decir, un n ú mero mayor de observaciones requiere un n ú mero mayor de grupos de clase o intervalos. El n ú mero de clases debe estar entre 5 y 15. Si no hay suficientes intervalos o si hay demasiados, se obtendr á poca informació n. Una tabla con demasiada concentraci ó n de datos no es significativa, lo mismo ser í a cierto en el otro extremo, si una tabla tuviera demasiados intervalos, habr í a una subconcentraci ó n de datos, y se sabr í a muy poco. Para determinar el n ú mero de clases se emplea la siguiente relaci ó n: 1 + 3.32 • log (n), donde "n" es el n ú mero de datos de la muestra. K = 1 + 3.32 log(n)
C) AMPLITUD O INTERVALO DE CLASE (i ) Cada grupo denominado tambi é n clase, debe poseer un tamaño o amplitud. A esta amplitud se le denomina intervalo y es representado por “ i”. Si se desea que cada grupo o clase posea igual intervalo, el rango debe ser dividido entre el n ú mero de grupos que se desea formar, entonces, el tamaño o anchura del intervalo o clase viene dado por i = Rango / No. de clases o sea i = R/K Para estudiar un hecho en el que la amplitud de la poblaci ó n es grande, se definen los intervalos de clase. Estas clases pueden tener una amplitud constante o variable; as í por ejemplo, si se trata de estudiar la estatura de un grupo de estudiantes universitarios, una vez elegida la muestra, es conveniente dividir en clases las estaturas de los alumnos investigados, los cuales se pueden clasificar de la siguiente forma: Menos de 160 cm De 160 a 170 cm De 170 a 180 cm Igual o mas de 180 cm
C) AMPLITUD O INTERVALO DE CLASE (i ) Se observa que la primera y ú ltima clase tienen amplitud desconocida, mientras que las otras dos tiene una amplitud de 11 cm. Los l í mites son 160 cm, 170 cm y 180 cm. Se llaman l í mites del intervalo a los valores extremos de dicho intervalo. Por ejemplo, dado el intervalo del ejemplo anterior 160-170 cm, diremos que 160 cm es el extremo inferior y que 170 cm es el extremo superior. Sin embargo, resulta un poco confuso pensar que los extremos son valores que se incluyen en dos intervalos de clase; para que esto no suceda, es necesario considerar ú nicamente el extremo inferior en cada intervalo, mientras que el superior se considera incluido en el siguiente intervalo o viceversa.
d) LIMITES APARANTES (La) Todo intervalo está formado por dos l í mites de clase o l í mites aparentes, un limite inferior y un limite superior. Los l í mites aparentes se utilizan para evitar ambig ü edad en la clasificaci ó n por intervalos. Por ejemplo, de las estaturas anteriores se tiene: menos 160 a 169, de 170 a 179, igual o m á s de 180 cm.
e) LIMITES REALES DE CLASE (Lr ) Debido a la discontinuidad que existe entre los grupos, conviene lograr que, donde finalice un grupo comience el siguiente, con lo cual se obtendr á n nuevos l í mites a los cuales se les denomina l í mites reales o verdaderos y se obtienen encontrando el punto medio de el l í mite aparente superior de un grupo y el l í mite aparente inferior del siguiente grupo. Tambi é n pueden calcularse a partir de los l í mites aparentes considerando que: Si los limites son numeros enteros , entonces , restar 0.5 al limite inferior y sumar 0.5 al limite superior Si los l í mites no son n ú meros enteros, se debe restar y sumar a los intervalos de clase 0.05 si tienen un solo decimal, 0.005 si tienen dos decimales, 0.0005 si tienen tres decimales, etc
f) MARCAS DE CLASE (X i ) Son los puntos medios de cada intervalo y son los valores usados para representar todos los datos resumidos en un intervalo particular.
EJEMPLO Si los limites de intervalo son 160 – 169, entonces los limites reales serán: 159.5 – 169.5 Y la marca de clase es (160 + 169)/2 = 164.5
FRECUENCIAS ESTADISTICA 1
FRECUENCIA ABSOLUTA O DE INTERVALO ( f i ) La frecuencia absoluta es la que indica c ó mo est á n distribuidos los datos en cada grupo, es decir, c ó mo est á repartida la cantidad total de datos entre los grupos. Indica cuantos datos posee el primer grupo, el segundo grupo, el tercero,...
FRECUENCIA RELATIVA ( f r ) La frecuencia relativa es la proporci ó n entre la frecuencia de un intervalo y el n ú mero total de datos, es decir, el valor de una fracci ó n cuyo numerador es la frecuencia absoluta y cuyo denominador es el n ú mero de individuos de la poblaci ó n. La frecuencia relativa est á comprendida siempre entre 0 y 1 y est á dada por:
FRECUENCIA REALTIVA (f % ) Si la frecuencia relativa la expresamos mediante porcentajes, encontramos la frecuencia porcentual. Se calcula multiplicando por 100 el valor de la frecuencia relativa. La frecuencia porcentual est á comprendida ló gicamente entre 0 y 100 y esta dada por: El uso de la frecuencia relativa o porcentual se vuelve esencial siempre que una serie de datos se compara con otras series de datos. Especialmente si difiere el n ú mero de observaciones en cada serie de datos .
FRECUENCIA ACUMULADA ABSOLUTA (F a ) La frecuencia acumulada identifica el n ú mero de observaciones acumuladas en cada grupo. Se calcula a partir de las frecuencias absolutas ya que estas proporcionan la suma de las repeticiones anteriores a un intervalo determinado
FRECUENCIA ACUMULADA RELATIVA (F r ) La frecuencia acumulada relativa es el cociente entre la frecuencia acumulada y el n ú mero total de datos observados, con lo que se obtiene la suma de las frecuencias relativas de las repeticiones anteriores a é sta. Se calcula de la siguiente forma:
EJEMPLO 1 ( Distribucion de frecuencias con enteros) Los puntos obtenidos por un grupo de 40 estudiantes en el curso de Física son: Calcular: Namero de clases. Rango. Intervalo. Distribución de frecuencias
SOLUCION El numero de grupos o clases a formar esta dado por K = 1 + 3.32 log 40 = 1 + 3.32 (1.60206) = 1 + 5.3188 = 6.3188 Aproximadamente tenemos que usar 6 ó 7 intervalos o clases b) El rango se calcula de la siguiente manera: R = Dato Mayor – Dato menor R = 98 – 20 R = 78 c) Intervalo i = 78/6.3188 i = 12.3440 Como los datos son números enteros se aproxima “i” al entero más cercano, entonces: i = 12
SOLUCION Los intervalos se calculan iniciando del dato menor ( se puede iniciar cualquier numero menor que el valor mínimo, sin embargo, es usual que el primer limite de la tabla de distribución de frecuencias sea el mínimo) (20). Los datos se muestran en la tabla 2.1. El primer intervalo de la tabla es 20 – 31 Tabla 2.1. Ejemplo de un grupo de 40 estudiantes de Física .
SOLUCION Frecuencias absolutas Para calcular las frecuencias hacemos un conteo del numero de datos que pertenecen a cada intervalo. El procedimiento puede ser: Ordenando los datos en forma ascendente o descendente Contando cuantos valores hay en cada intervalo, es decir de 20 a 31 hay 2, de 32 a 43 hay 7, etcétera. O bien por cada dato del grupo original marcamos mediante una línea en el intervalo al que pertenece, como se ilustra a continuación
EJEMPLO 2 DISTRIBUCION DE FRECUENCIAS
EJEMPLO 2 DISTRIBUCION DE FRECUENCIAS Los siguientes datos son kilómetros por galón que registraron 30 vehículos en un recorrido de 100 km por la ciudad. Construir una tabla de distribución de frecuencias que contenga: Frecuencias relativas ( f r ). Frecuencias acumuladas absolutas (F a ). Lí mites reales.
SOLUCION Se procede como en el ejemplo anterior, de la siguiente manera: Rango= 37.1 - 16.4 = 20.7 Nú mero de grupos o clases “K” K =1 + 3.32 * log 30 = 1 + 3.32 * 1.47712 K = 1 + 4.9040 = 5.904 Tamañ o del intervalo = i = 20.7 / 5.9040 i = 3.50607 Como se indicó anteriormente se debe aproximar de acuerdo al nú mero de decimales que tengan los datos originales, come en este caso los datos tienen un decimal, entonces: i = 3.5
SOLUCION El primer intervalo se construye de la siguiente forma: De manera que el primer intervalo es 16.4 – 19.8
Los Incisos (a) y (b) se muestran en la tabla Tabla 2.3. Frecuencias absolutas relativas y frecuencia acumulada absoluta
SOLUCION c) Para el cálculo de los lí mites reales se procede de la siguiente manera: Tambi é n se puede calcular el promedio de la siguiente manera: Además la diferencia entre el límite real superior e inferior es igual a la amplitud de manera que: Límite real superior = lí mite real inferior + amplitud = 16.35 + 3.5 = 19.85 Los resultados se muestran en la tabla 2.4.
Tabla 2.4. Limites Reales del Ejemplo 2
OBSERVACIONES PARA LIMITES REALES Cada limite real superior corresponde al limite real inferior del siguiente intervalo La diferencia entre los limites reales de un intervalo es igual al tamaño del intervalo “i”.
EJEMPLO 3 DISTRIBUCION DE FRECUENCIAS
EJEMPLO 3 Los siguientes datos corresponden a los precios de paquetes de servilletas, registrados en 50 diferentes supermercados. Construir una tabla de distribución de frecuencias que contenga: Frecuencias porcentuales ( f r % ). Frecuencias acumuladas absolutas relativas (F r ). Lí mites reales. Marcas de clase.
SOLUCION El procedimiento es el siguiente: S e calcula el rango: R = Dma - Dme R = 5.90 - 3.15 = 2.75 2. Nú mero de grupos o clases a formar K =1 + 3.32 * log50 = 1 + 3.32 * 1.69897 K = 6.64058 3. Tamañ o del intervalo i =2.75 / 6.64058 i = 0.41412 Como se indicó anteriormente se debe aproximar de acuerdo al nú mero de decimales que tengan los datos originales, como en este caso los datos tienen dos decimales, entonces: i = 0.41
Los incisos a y b se muestran en la siguiente tabla Tabla 2.5 Frecuencias absolutas porcentuales y frecuencias relativas
“LIMITES APARENTES” El primer intervalo se construye de la siguiente forma: Limite aparente inferior: 3.15; De manera que el primer intervalo es 3.15 - 3.55. Los incisos a y b se muestran en la siguiente tabla. Aproximación para datos con dos decimales Ancho del intervalo
CALCULO DE “LIMITES REALES” c) Para el cálculo de límites reales se procede de la siguiente manera: Limite real inferior = Lri =3.15 - 0.01/2 = 3.145 Limite real superior = Lrs = 3.55 + 0.01/2 = 3.555
SOLUCION “MARCAS DE CLASE” d) Para calcular las marcas de clase se realiza el siguiente procedimiento X 1 = Lai + Las = Lri + Lrs 2 2 X 1 = 3.15 + 3.55 = 3.35 2 Los Resultados se muestran en la tabla 2.6.
Tabla 2.6. Limites Aparentes, Limites Reales y marcas de clase del Ejemplo