Descripción de datos para probabilidad y estadistica.pptx

AlonsoJm2 1 views 77 slides Oct 10, 2025
Slide 1
Slide 1 of 77
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10
Slide 11
11
Slide 12
12
Slide 13
13
Slide 14
14
Slide 15
15
Slide 16
16
Slide 17
17
Slide 18
18
Slide 19
19
Slide 20
20
Slide 21
21
Slide 22
22
Slide 23
23
Slide 24
24
Slide 25
25
Slide 26
26
Slide 27
27
Slide 28
28
Slide 29
29
Slide 30
30
Slide 31
31
Slide 32
32
Slide 33
33
Slide 34
34
Slide 35
35
Slide 36
36
Slide 37
37
Slide 38
38
Slide 39
39
Slide 40
40
Slide 41
41
Slide 42
42
Slide 43
43
Slide 44
44
Slide 45
45
Slide 46
46
Slide 47
47
Slide 48
48
Slide 49
49
Slide 50
50
Slide 51
51
Slide 52
52
Slide 53
53
Slide 54
54
Slide 55
55
Slide 56
56
Slide 57
57
Slide 58
58
Slide 59
59
Slide 60
60
Slide 61
61
Slide 62
62
Slide 63
63
Slide 64
64
Slide 65
65
Slide 66
66
Slide 67
67
Slide 68
68
Slide 69
69
Slide 70
70
Slide 71
71
Slide 72
72
Slide 73
73
Slide 74
74
Slide 75
75
Slide 76
76
Slide 77
77

About This Presentation

descripción de datos para la materia probabilidad y estadística


Slide Content

Introducción a la Estadística y Probabilidad Tema 2. Descripción de datos 1

Contenido Contenidos de este tema Tabla de frecuencias Representación gráfica Medidas de posición Medidas de dispersión Medidas de Asimetría y curtosis Diagrama de cajas 2

1. Contenidos de este tema

1. Contenidos de este tema Distribuciones de frecuencias: atributos y variables cuantitativas. Representación gráfica: atributos y variables cuantitativas. Tratamiento estadístico Medidas de posición: medias, mediana, moda y cuantiles. Medidas de dispersión: absolutas y relativas. Medidas de forma: asimetría y curtosis. Variable tipificada.

2. Tabla de frecuencias

2. Tabla de frecuencias Para organizar y resumir datos, las tablas de frecuencias son una herramienta útil. Si la variable de estudio es una variable cualitativa o cuantitativa discreta y los datos se recogen a partir de una muestra de tamaño n , la tabla tiene: Una primera columna (llamada clases o grupos ) que contiene todas las posibles respuestas de dicha variable. A continuación, se le añade la columna de frecuencia absoluta ( f i ) que contiene el número de observaciones correspondientes a cada clase. La siguiente columna recoge las frecuencias absolutas acumuladas ( F i ) , que se calculan como suma de las frecuencias absolutas de las clases anteriores. La siguiente columna contiene las frecuencias relativas ( h i ) , que se calculan como cociente entre las frecuencias absolutas y el tamaño de muestra ( h i = f i / n ) . A continuación, se añaden las frecuencias relativas acumuladas ( H i ) , calculadas como la suma de las frecuencias relativas de las clases anteriores. Por último, la tabla concluye con las frecuencias relativas y relativas acumuladas en tantos por cien ( h i % y H i %).

2. Tabla de frecuencias Tabla 1. Tabla de Frecuencias para variable cualitativa o cuantitativa discreta Clases f i F i h i H i h i % H i % n 1 100 Totales n 1 100

2. Distribución de frecuencias Ejemplo - Para variable cualitativa o cuantitativa discreta Se preguntó a un total de 2.000 viajeros frecuentes (de negocios) qué ciudad de la región central de Estados Unidos preferirían: Indianápolis, St. Louis, Chicago o Milwaukee. De ellos, 100 contestaron que Indianápolis; 450, St. Louis; 1.300, Chicago; y el resto dijo que Milwaukee. Elabore una tabla de frecuencias para resumir esta información.

2. Distribución de frecuencias Solución del ejemplo Clases f i F i h i H i h i % H i % Indianápolis 100 100 0.05 0.05 5 % 5 % St. Louis 450 550 0.225 0.275 22.5 % 27.5 % Chicago 1300 1850 0.65 0.925 65 % 92.5 % Milwaukee 150 2000 0.075 1 7.5 % 100 Totales 2000 1 100

2. Tabla de frecuencias Si la variable de estudio es cuantitativa continua y los datos se recogen a partir de una muestra de tamaño n, para construir la tabla de frecuencias es necesario decidir en cuántos intervalos distribuiremos los datos (clases o grupos). Para ello vamos a ver cómo definimos la amplitud de los intervalos .

2. Tabla de frecuencias w = amplitud de los intervalos = Amplitud de los intervalos Hay que decidir el número, k , de intervalos (clases). Los intervalos (clases) deben ser de la misma amplitud, w : ( n ú m . mayor − n ú m . menor ) n ú m . de intervalos Tanto k como w deben redondearse al alza, posiblemente al siguien - te número entero mayor. 3. Los intervalos (clases) deben ser inclusivos y no solaparse. En definitiva, la tabla de frecuencias tendría una estructura similar a la de una variable cualitativa, pero con una columna más, que recogería el punto medio de los intervalos. Esta columna recibe el nombre de marca de clase ( x i ).

2. Tabla de frecuencias Tabla 2. Tabla de Frecuencias para variable cuantitativa continua Clases x i f i F i h i H i h i % H i % n 1 100 Totales n 1 100

2. Distribución de frecuencias Ejemplo - Para variable cuantitativa continua Se desea estudiar el índice de obesidad de los jóvenes de entre 18 y 25 años. Para ello se extrae una muestra representativa de la población de tamaño 500 y se anota el peso de cada individuo. Individuo 1 2 3 4 ... 499 500 Peso (kg) 50.1 62.3 58.1 49.5 ... 72.4 103.3

2. DISTRIBUCIÓN DE FRECUENCIAS Solución del ejemplo Vamos a construir la tabla de frecuencias para variables cuantitativas continuas con los datos anteriores. Vamos a decidir el número de intervalos. Para ello utilizaremos el término amplitud . La variable de estudio es una variable cuantitativa continua. Como el tamaño muestral es n = 500, deberíamos distribuir los datos entre 8 y 10 intervalos. En nuestro caso vamos a considerar 10 intervalos. Imaginemos que la persona con menor peso ha sido un individuo con 42,7 kg y la persona con mayor peso pesa 112,5 kg. Redondeando, consideramos que el rango de peso oscila entre 40 y 120 kg. Así, la amplitud de los intervalos sería: w = 1 20 − 40 = 8 10

2. Distribución de frecuencias La tabla de frecuencias quedaría del siguiente modo: Peso (kg) x i f i F i h i H i h i % H i % [40, 48[ 44 26 26 0.052 0.052 5.2 % 5.2 % [48, 56[ 52 200 226 0.400 0.452 40 % 45.2 % [56, 64[ 60 150 376 0.300 0.752 30 % 75.2 % [64, 72[ 68 50 426 0.100 0.852 10 % 85.2 % [72, 80[ 76 20 446 0.040 0.892 4 % 89.2 % [80, 88[ 84 21 467 0.042 0.934 4.2 % 93.4 % [88, 96[ 92 20 487 0.040 0.974 4 % 97.4 % [96, 104[ 100 10 497 0.020 0.994 2 % 99.4 % [104, 112[ 108 497 0.994 % 99.4 % [112,120[ 116 3 500 0.006 1 .6% 100% Total 500 1 100

3. Representación gráfica

3. Representación gráfica Una representación gráfica nos permite ver de una manera rápida los resultados obtenidos. Es una herramienta para representar la distribución de frecuencias .

3.1. Representación gráfica para describir variables cualitativas y cuantitativas discretas DIAGRAMA DE BARRAS El diagrama de barras es utilizado cuando el objetivo es llamar la atención sobre la frecuencia de cada categoría, donde la altura de cada rectángulo representa la frecuencia.

3.1. Representación gráfica para describir variables cualitativas y cuantitativas discretas Ejemplo de Diagrama de Barras La revista Forbes enumera anualmente las principales empresas del mundo. La siguiente tabla muestra la distribución de frecuencias de las cinco empresas que tienen mayor capitalización del mundo en 2018. Empresas Capitalización de mercado f i h i % ICBC 311.01 0.19 China Construction Bank 261.17 0.16 JP Morgan Chase 387.67 0.24 Berkshire Hathaway 491.89 0.30 Agricultural Bank of China 184.13 0.11

3.1. Representación gráfica para describir variables cualitativas y cuantitativas discretas DIAGRAMA DE SECTORES o GRÁFICO DE TARTA El diagrama de sectores o gráfico de tarta trata de visualizar la proporción de las frecuencias de cada categoría. En este caso, el círculo representa la proporción total y los sectores que lo parten tienen un área proporcional a la frecuencia de cada categoría.

3.1. Representación gráfica para describir variables cualitativas y cuantitativas discretas Ejemplo diagrama de sectores o gráfico de tarta El siguiente gráfico representa la información del ejemplo anterior:

3.2. Representación gráfica para describir variables continuas HISTOGRAMA El histograma es un gráfico formado por un conjunto de rectángulos (que reciben el nombre de intervalos de clase ), donde cada uno representa un intervalo de agrupación o clase. Los intervalos corresponden a los construidos en una tabla de frecuencias, donde la altura de cada barra es proporcional al número de observaciones que hay en ese intervalo. El diagrama de barras está pensado, sobre todo, para variables ordinales, mientras que el histograma está concebido para variables que siguen una escala numérica de razón (cuantitativas, idealmente continuas). Lo importante de un histograma son las áreas de los rectángulos, no sus alturas.

3.2. Representación gráfica para describir variables continuas Ejemplo de Histograma Uso del teléfono móvil (en minutos) f i H i % [220, 230[ 5 4.5 [230, 240[ 8 11.8 [240, 250[ 13 23.6 [250, 260[ 22 43.6 [260, 270[ 32 72.7 [270, 280[ 13 84.5 [280, 290[ 10 93.6 [290, 300[ 7 100

3.2. Representación gráfica para describir variables continuas Ejemplo de Histograma

3.2. Representación gráfica para describir variables continuas Interpretar un Histograma Para interpretar el significado de los rectángulos , vamos a fijarnos detenidamente en la figura de la diapositiva anterior. Si nos preguntaran cuántas personas de nuestra muestra hablan entre 220 y 230 minutos, nosotros podríamos responder que un 5 %. Si nos preguntaran cuántas personas de nuestra muestra hablan entre 260 y 270 minutos, responderíamos que aproximadamente un 32 %, siendo esta última la más frecuente.

3.2. Representación gráfica para describir variables continuas Representación gráfica. Otros gráficos. Tallos-hojas Un diagrama de tallo y hojas ( stem and leaf en inglés) es un gráfico alternativo al histograma que combina la representación gráfica con la información proporcionada por las cifras . En este gráfico, los datos se agrupan de acuerdo con sus primeros dígitos, llamados tallos , y se hace un listado de los últimos dígitos, llamados hojas , de cada miembro de su clase. Las hojas se muestran individualmente en orden ascendente después de cada uno de los tallos. La ventaja es que el rectángulo está relleno de los propios valores numéricos, pero se evita la repetición de los primeros dígitos de cada cifra . Se puede elegir su amplitud, aunque siempre es preferible que las amplitudes sean de 5 o de 10 unidades. De un vistazo aparece el histograma. No hay más que girar la figura mentalmente 90 grados hacia la izquierda.

3.2. Representación gráfica para describir variables continuas Ejemplo Tallos- hojas Construyamos un diagrama de tallo y hojas de las horas que dedican 20 estudiantes a estudiar para un examen de estadística: 3.5 2.8 4.5 6.2 4.8 2.3 2.6 3.9 4.4 5.5 5.2 6.7 3.0 2.4 5.0 3.6 2.9 1.0 2.8 3.6

3.2. Representación gráfica para describir variables continuas Solución ejemplo Tallos- hojas Para construir el diagrama, es necesario ordenar los datos de menor a mayor: 1|0 2|346889 3|05669 4|458 5|025 6|27

4. Medidas de posición

4. Medidas de posición

4.1. Medidas de centralización Para obtener información numérica sobre una observación típica de los datos, utilizamos medidas de centralización. En este apartado analizamos la media, la moda y la simetría de los datos.

4.1. Medidas de centralización Media Dado un conjunto de datos numéricos ( x 1 , ..., x n ), se define la media aritmética por donde el símbolo ∑ , que se denomina sumatorio, quiere decir que debemos sumar todos los valores de la variable. Para datos discretos agrupados (por ejemplo tabla de la diapositiva 7), el cálculo de la media se efectúa teniendo en cuenta los valores distintos de la variable ( x j ) y sus frecuencias relativas ( fr ( x j )):    

Los siguientes datos representan las edades (en años) de un grupo de 10 personas en un taller de cocina: 22, 25, 19, 30, 27, 24, 20, 28, 21, 23 Calcula la media de las edades del grupo. Si una nueva persona de 32 años se une al taller, ¿cuál sería la nueva media?

4.1. Medidas de centralización Mediana Ordenada la distribución, de menor a mayor, la mediana es el valore que divide los datos en dos partes iguales (en cuanto al número de observaciones se refiere), es decir, deja a ambos lados de la distribución el mismo número de frecuencias. (si hay un número par de datos entonces se hace la media aritmética entre los dos valores centrales). Viene expresada en las mismas unidades que la variable de estudio.

Los siguientes datos representan el número de libros leídos en un año por un grupo de 9 estudiantes: 5, 8, 3, 10, 7, 6, 4, 9, 25, 8, 3, 10, 7, 6, 4, 9, 2 Calcula la mediana del número de libros leídos.

4.1. Medidas de centralización Moda La moda, si existe, es el valor que aparece con más frecuencia.

Los siguientes datos representan las calificaciones (sobre 10) obtenidas por un grupo de 12 estudiantes en un examen de matemáticas: 7, 5, 8, 6, 7, 9, 5, 7, 6, 8, 7, 47, 5, 8, 6, 7, 9, 5, 7, 6, 8, 7, 4 Si dos estudiantes adicionales obtienen calificaciones de 5 y 8, ¿cómo cambia la moda?

4.2. Medidas de posición no central Cuantiles Son aquellos valores de la variable, que ordenados de menor a mayor, dividen a la distribución en partes, de tal manera que cada una de ellas contiene el mismo número de frecuencias. Se dividen en: Cuartiles : Dividen a la distribución en cuatro partes iguales. Deciles : Dividen a la distribución en 10 partes iguales. Percentiles : Dividen a la distribución en 100 partes iguales.  

Cuartiles Los siguientes datos representan los tiempos (en minutos) que tardan 11 estudiantes en resolver un examen: 15, 20, 22, 18, 25, 30, 12, 17, 21, 24, 19 Calcula los cuartiles Q1​, Q2​ (mediana) y Q3​ e interpreta su significado. 12, 15, 17, 18, 19, 20, 21, 22, 24, 25, 30

Deciles Las estaturas (en cm) de 15 jugadores de baloncesto son: 185, 190, 192, 178, 195, 200, 182, 188, 198, 175, 180, 185, 193, 187, 205 Encuentra el decil 4 (D4 D4 ​) y el decil 8 (D8 D8 ​) . ¿Qué porcentaje de jugadores mide menos de D4 D4 ​? 175, 178, 180, 182, 185, 185, 187, 188, 190, 192, 193, 195, 198, 200, 205

Percentiles Los salarios mensuales (en miles de $) de 20 empleados son: 25, 30, 35, 22, 40, 28, 45, 32, 50, 27, 38, 42, 33, 29, 48, 36, 26, 44, 31, 39 Determina el percentil 35 ( P35 ​) y el percentil 90 (P90​) . ¿Qué salario representa el 35% inferior? 22, 25, 26, 27, 28, 29, 30, 31, 32, 33, 35, 36, 38, 39, 40, 42, 44, 45, 48, 50

5. Medidas de dispersión

5. Medidas de dispersión La media no es por sí sola una descripción completa o suficiente de los datos. En este apartado veremos descriptivos que miden la variabilidad o dispersión de las observaciones con respecto a la media.

5. Medidas de dispersión

5. Medidas de dispersión Rango El rango es la diferencia entre la observación mayor y la menor. Rango = Valor máximo - Valor mínimo = X m á x − X min

5. Medidas de dispersión Rango intercuartílico (RIC) El rango intercuartílico (RIC) mide la dispersión que hay en el 50 por ciento central de los datos; es la diferencia entre las observación Q 3 ( tercer cuartil o percentil 75 ) y la observación Q 1 ( primer cuartil o percentil 25 ). RIC = Q 3 − Q 1 donde Q 3 y Q 1 se encuentran situados en la posición , 75( n + 1) y , 25( n + 1), respectivamente, cuando los datos se encuentran orde - nados en sentido ascendente.

5. Medidas de dispersión Varianza 1 Definimos varianza como la media aritmética de las desviaciones de la media elevada al cuadrado. Varianza = Desviación estándar poblacional La desviación estándar poblacional describe la dispersión media en torno a la media. Desviaci ó n est á ndar = σ = 1 Los artículos en revistas científicas suelen utilizar la desviación estándar poblacional ( σ ) y la varianza poblacional ( σ 2 ), dejando a un lado la desvia ción estándar muestral ( s ) y la varianza muestral ( s 2 ).     = cada dato individual. = media poblacional( ). = número total de datos en la población.   Para desviación y varianza muestral la formula es prácticamente la misma solo cambiamos N por n-1

5. Medidas de dispersión Coeficiente de variación (CV) Es una medida de la dispersión relativa que expresa la desviación típica en porcentaje respecto a la media (siempre que la media sea positiva). Con el coeficiente de variación, podemos comparar la dispersión de dos variables que se miden en distintas escalas.  

Ejemplo Ejemplo Se considera una muestra aleatoria de ocho empresas tailandesas. Los beneficios por acción de cada empresa han experimentado este año las siguientes variaciones porcentuales en comparación con el año pasado: 0 %, 0 %, 8.1 %, 13.6 %, 19.4 %, 20.7 %, 10 % y 14.2 %. Realicemos un análisis descriptivo de los datos.

Ejemplo Solución del Ejemplo La variación porcentual media de los beneficios por acción de esta muestra es la siguiente: 0+0+8 , 1+13 , 6+19 , 4+20 , 7+10+14 , 2 8 = = 10 , 75 ≈ 10 , 75 %   Para calcular la variación porcentual mediana de los beneficios por acción, se ordenan los valores de forma ascendente: 0 %, 0 %, 8.1 %, 10 %, 13.6 %, 14.2 %, 19.4 %, 20.7 % 2 Me = 10+13 , 6 = 11 , 8 % Podemos fijarnos que la tasa porcentual modal (Mo = 0 %) no es un buen representante del centro de estos datos. Ahora calculamos la varianza y la desviación típica poblacional : 39    

Ejercicio de Medidas de Dispersión Un profesor registró las calificaciones (sobre 100 puntos) de dos grupos de estudiantes en un examen: Grupo A: 85, 90, 88, 92, 87 Grupo B: 70, 95, 60, 100, 75 Calcula el rango de cada grupo. Determina la varianza y la desviación estándar (muestral) para ambos grupos. Compara la dispersión de los datos y explica cuál grupo tiene calificaciones más homogéneas.

6. Medidas de Asimetría y curtosis

6.1. Medidas de Asimetría y curtosis Estas medidas informan sobre dos aspectos importantes de la forma de la distribución: Por un lado, miden su grado de asimetría. Por otro, su grado de homogeneidad. Al ser medidas de forma, no dependen de las unidades de medida de los datos. 40

6.1. Medidas de Asimetría y curtosis 40

6.1. Coeficiente de Asimetría Coeficiente de asimetría Se expresa de la siguiente forma: Para saber la forma de la distribución, debemos fijarnos en el signo del coeficiente de asimetría. En este sentido, las distribuciones pueden ser simétricas o asimétricas: Son simétricas cuando las dos colas de su histograma (derecha e izquierda) tienen la misma longitud. Son asimétricas cuando las colas tienen distinta longitud. En el caso de la asimetría, podemos encontrar que puede ser positiva o negativa: Si el coeficiente (sesgo) es negativo, la distribución para valores inferiores a la media se alarga. En este caso, la cola de la izquierda será más larga. Si el coeficiente (sesgo) es positivo, la cola de la distribución se extiende para valores superiores a la media. En este caso, la cola de la derecha es más prolongada. 41  

6.1. Coeficiente de Asimetría Los conceptos de la diapositiva anterior se ilustran en la siguiente figura: 42

6.1. Coeficiente de Asimetría Otra medida de asimetría poco utilizada es la siguiente (también adimensional): Para concluir... Lo ideal para muchos procedimientos estadísticos es que la asimetría no sea grande y que el coeficiente de asimetría esté lo más próximo posible a 0.   43

Hagamos un ejemplo Datos: 3,5,8,10,12    

Coeficiente de curtosis Para hallar el coeficiente de curtosis , utilizaremos la siguiente fórmula: 6.2. Coeficiente de Curtosis El coeficiente de curtosis es siempre mayor o igual que 1. Este co eficiente es importante porque nos informa respecto a la heteroge neidad de la distribución. 44  

6.2. Coeficiente de Curtosis Según el resultado obtenido mediante el coeficiente de curtosis, las formas que puede adoptar la curva son: K=0 Mesocúrtica : grado de concentración medio alrededor de los valores centrales de la variable.(Curtosis similar a la normal ) K >0 Leptocúrtica : grado de concentración elevado( Distribución más puntiaguda ). K<0 Platicúrtica : grado de concentración reducido ( Distribución más plana ). 45

7. Diagrama de cajas

7. Diagrama de cajas Diagrama de caja Un diagrama de caja es una representación gráfica basada en cuartiles que que ayuda a presentar un conjunto de datos. Para construir un diagrama de caja solo se necesitan cinco estadísticos, que son valor mínimo, primer cuartil ( Q 1 ), mediana, tercer cuartil ( Q 3 ) y valor máximo.

7. Diagrama de cajas Ejemplo Alexander’s Pizza ofrece entregas gratuitas de pizza a 24km a la rotonda. Alex, el propietario, desea información relacionada con el tiempo de entrega. ¿Cuánto tarda una entrega típica? ¿En qué margen de tiempo deben completarse la mayoría de las entregas? Alex recopiló la siguiente información de una muestra de 20 entregas: Valor mínimo = 13 minutos. Q 1 = 15 minutos. Mediana = 18 minutos. Q 3 = 22 minutos. Valor máximo = 30 minutos. Elabore un diagrama de caja de los tiempos de entrega. ¿Qué conclusiones tiene acerca de estos?

7. Diagrama de cajas Solución del Ejemplo El primer paso para elaborar un diagrama de caja consiste en crear una escala adecuada a lo largo del eje horizontal. Luego, se debe dibujar una caja que inicie en Q 1 (15 minutos) y termine en Q 3 (22 minutos). Dentro de la caja trace una línea vertical para representar a la mediana (18 minutos). Por último, prolongue líneas horizontales a partir de la caja dirigidas al valor mínimo (13 minutos) y al valor máximo (30 minutos). Estas líneas horizontales que salen de la caja, a veces reciben el nombre de bigotes , en virtud de su virtud de su parecido a los bigotes de un gato.

7. Diagrama de cajas Continuación solución del Ejemplo... El diagrama de caja también revela que la distribución de los tiempos de entrega tiene un sesgo positivo 2 . ¿Cómo saber que esta distribución tiene un sesgo positivo? En este caso, hay dos tipos de información que lo sugieren. Primero, la línea punteada a la derecha de la caja, que va de 22 minutos ( Q 3 ) al tiempo máximo de 30 minutos, es más larga que la línea punteada a la izquierda, que va de 15 minutos ( Q 1 ) al valor mínimo de 13 minutos. En otras palabras, 25 % de los datos mayores que el tercer cuartil se encuentra más disperso que 25 % que es menor al primer cuartil. Segundo, la mediana no se encuentra en el centro de la caja. La distancia del primer cuartil a la mediana es menor que la distancia de la mediana al tercer cuartil. El número de tiempos de entrega entre 15 y 18 minutos es el mismo que el número de tiempos de entrega entre 18 y 22 minutos. 2 Recuerde que el sesgo se define como la falta de simetría en un conjunto de datos.

100 P L p   N  1  MEDIDAS DE POSICIÓN (Para series simples o series No agrupadas Para encontrar el lugar posicional de cuartiles, deciles y percentiles, para series no agrupadas , debemos utilizar la siguiente fórmula: (Esta brinda la ubicación, que se tiene que buscar el los datos ordenados ascendentemente). 100 p L   n  1  P Población Muestra Ejemplo: El dueño de un gimnasio está interesado en conocer el tiempo (en minutos) que tardan sus clientes en trasladarse desde su casa hasta el gimnasio, para ello pasa una encuesta a ciertos clientes, las respuestas fueron las siguientes: Donde P: es el numero del percentil buscado En los siguientes ejemplos se usa el Lp para buscar cuartilies, deciles y percentiles en función de percentiles.

MEDIDAS DE POSICIÓN (Para series simples o series No agrupadas 5 15 22 35 45 50 7 16 25 36 46 51 8 18 25 38 47 53 10 18 28 40 49 54 10 20 30 42 49 55 Minutos que tardan las personas en trasladarse de su casa al gimnasio Con la siguiente información calcule e interprete: La mediana Cuartil uno El decil cuatro y decil siete El percentil 37 y percentil 85

MEDIDAS DE POSICIÓN (Para series simples o series No agrupadas 100 p L   n  1  P 100 p L   30  1  50 5 15 22 35 45 50 7 16 25 36 46 51 8 18 25 38 47 53 10 18 28 40 49 54 10 20 30 42 49 55 p L  15.5 Esto quiere decir que el valor de está entre la mediana el décimo quinto y décimo sexto dato Minutos que tardan las personas en trasladarse de su casa al gimnasio a) La mediana Md = P 50 Procedimiento para encontrar la mediana: 1º Se resta el dato menor al mayor de las 2 posiciones consecutivas involucradas: 35- 30=5 2º Se multiplica el resultado por el decimal buscado en la ubicación: 5 x 0.5= 2.5 3º Se suma el resultado al dato menor (que seria la posición 15): 30 + 2.5 = 32.5 Entero: 15 Decimal: 0.5

R/ Md = 32.5 minutos Interpretación: El 50% de las personas tarda menos de 32.5 minutos para trasladarse desde su casa al gimnasio y el otro 50% de las personas tarde más de 32.5 minutos en el traslado. MEDIDAS DE POSICIÓN 50% 50% Md= 32.5 minutos

MEDIDAS DE POSICIÓN (Para series simples o series No agrupadas 100 p L   n  1  P 100 p L   30  1  25 5 15 22 35 45 50 7 16 25 36 46 51 8 18 25 38 47 53 10 18 28 40 49 54 10 20 30 42 49 55 L p  7.75 Esto quiere decir que el valor del Q 1 está entre el séptimo y octavo dato Minutos que tardan las personas en trasladarse de su casa al gimnasio b) Cuartil uno Q 1 = P 25 Procedimiento para encontrar el cuartil uno: 1º Se resta el dato menor al mayor: 18- 16=2 2º Se multiplica el resultado por la separación entre los datos: 2 x 0.75= 1.5 3º Se suma el resultado al dato menor: 16 + 1.5 = 17.5

Q 1 = 17.5 minutos Interpretación: El 25% de las personas tarda menos de 17.5 minutos para trasladarse desde su casa al gimnasio y el otro 75% de las personas tarde más de 17.5 minutos en el traslado. R/ Q 1 = 17.5 minutos MEDIDAS DE POSICIÓN (Para series simples o series No agrupadas 25% 75%

MEDIDAS DE POSICIÓN (Para series simples o series No agrupadas 100 p L   n  1  P 100 p L   30  1  40 L p  12.4 5 15 22 35 45 50 7 16 25 36 46 51 8 18 25 38 47 53 10 10 18 20 28 30 40 42 49 49 54 55 Esto quiere decir que el valor del D 4 está entre el decimo segundo y decimo tercer dato Minutos que tardan las personas en trasladarse de su casa al gimnasio c) Decil cuatro D 4 = P 40 Nota importante: Como en este caso el valor se repite, no se hace ningún procedimiento, el valor del cuantil o fractil buscado será precisamente ese valor. Por lo tanto el valor del decil cuatro es igual a 25.

R/ D 4 = 25 minutos Interpretación: El 40% de las personas tarda menos de 25 minutos para trasladarse desde su casa al gimnasio y el otro 60% de las personas tarde más de 25 minutos en el traslado. MEDIDAS DE POSICIÓN (Para series simples o series No agrupadas 40% 60% D 4 = 25 minutos

MEDIDAS DE POSICIÓN 100 p L   n  1  P 100 p L   30  1  70 Minutos que tardan las personas en trasladarse de su casa al gimnasio c) Decil siete L p  21.7 D 7 = P 70 5 15 22 35 45 50 7 16 25 36 46 51 8 18 25 38 47 53 10 10 18 20 28 30 40 42 49 49 54 55 Esto quiere decir que el valor del D 7 está entre el vigésimo primero y vigésimo segundo dato 1º Se resta el dato menor al mayor: 46- 45=1 2º Se multiplica el resultado por la separación entre los datos: 1 x 0.7= 0.7 3º Se suma el resultado al dato menor: 45 + 0.7 = 45.7 Procedimiento para encontrar el decil siete:

MEDIDAS DE POSICIÓN R/ D 7 = 45.7 minutos Interpretación: El 70% de las personas tarda menos de 45.7 minutos para trasladarse desde su casa al gimnasio y el otro 30% de las personas tarde más de 45.7 minutos en el traslado. 70% 30% D 7 = 45.7 minutos El literal d) será resuelto por los estudiantes en su cuaderno, con el objetivo de preguntar dudas.

MEDIDAS DE POSICIÓN (Para series agrupadas) Fórmulas para series agrupadas: f D 1 1 Ri D  L  10 * ic Deciles: n x 1  faa Cuartiles: * ic f D 2 n x 2  faa Ri  10 2 D  L f D 5 5 Ri n x 5  faa D  L  10 * ic f n D 9 9 Ri x 9  faa D  L  10 * ic f n Q 1 1 Ri x 1  faa Q  L  4 * ic f * ic 4 Q 3 n x 3  faa Q 3  L Ri  f Q 2 2 Ri n x 2  faa Q  L  4 * ic El procedimiento es exactamente el mismo que para la mediana de datos agrupados

MEDIDAS DE POSICIÓN (Para series agrupadas ) f P n 2 x 2  faa P 2  L i  100 * ic f n P 27 27 i x 27  faa P  L  100 * ic f P 43 43 i n x 43  faa P  L  100 * ic Percentiles: f n P 1 1 i x 1  faa P  L  100 * ic f P 99 99 i n x 99  faa P  L  100 * ic En todas las formulas Li será el limite real Fórmulas para series agrupadas: inferior (se le resta 0.5 al limite inferior absoluto de la clase que ubica al decil, cuartil o percentil buscado. Faa: Frecuencia acumulada anterior a la clase. F: Frecuencia absoluta de la clase que se esta usando.
Tags