10078081_Medidas_de_varaiabilidad_Asimetria_y_curtosis (10) (2).ppt

ssuser3a21df 0 views 31 slides Oct 21, 2025
Slide 1
Slide 1 of 31
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10
Slide 11
11
Slide 12
12
Slide 13
13
Slide 14
14
Slide 15
15
Slide 16
16
Slide 17
17
Slide 18
18
Slide 19
19
Slide 20
20
Slide 21
21
Slide 22
22
Slide 23
23
Slide 24
24
Slide 25
25
Slide 26
26
Slide 27
27
Slide 28
28
Slide 29
29
Slide 30
30
Slide 31
31

About This Presentation

DDDDDDDDDDDD


Slide Content

1
MEDIDAS DE VARIABILIDAD
PROFESOR: ROLAND
ALCANTARA R.
Rango
Rango intercuartil
Variancia
Desviación estándar
Coeficiente de variabilidad

2
Introduccion
Cuando se dispone de
información de una
variable es necesario
conocer si los datos
recopilados muestran
una variabilidad
significativa.
 




 


  

3
Si los datos son muy semejantes entre si, se
observará que no se encuentran muy dispersos con
respecto a la media; sin embargo, cuando los datos
presentan diferencias importantes entre si, se
apreciara que los datos son muy dispersos.
Idea de dispersión
A B

4
En todo análisis estadístico el grado de En todo análisis estadístico el grado de
variabilidad es importante pues de esto variabilidad es importante pues de esto
depende el depende el grado degrado de confiabilidad de las confiabilidad de las
estimaciones que se realicenestimaciones que se realicen..
Importancia de una medida
de dispersión

5
Rango
Es la diferencia entre el valor máximo de
las observaciones y el valor mínimo de las
observaciones.
R= Obs. Mayor – Obs. Menor
Nos da una idea muy rápida de dispersión.
Rango intercuartil
RIC=Q
3-Q
1
también nos da idea de dispersión pero en
el 50% central de los datos.

6
Varianza
Es el promedio de las desviaciones de las
observaciones con respeto a su media, es
una medida de variabilidad absoluta.
 
21
2
2
und
N
X
N
i
i





Varianza
poblacional
 
2
22
1
2
2
11
u
n
XnX
n
XX
s
n
i
i









Varianza
muestral

7
Desviación estándar
Se define como la raíz cuadrada de la
varianza. Tiene las mismas unidades que los
datos.
s Varianza

8
desviación (muestra)
desviación (población)
i i
i i
d X X
d X
 
 
2 2 2
2 2(10 13) (13 13) (16 13)
6 puntos ; 6 puntos
3
Y Y
 
    
  
Las notas de dos estudiantes X e y en cierto curso son:
X: 12, 13 y 14; Y: 10, 13 y 16
Ejemplo:
2 2 2
2 2(12 13) (13 13) (14 13) 2 2
puntos ; puntos
3 3 3
X X
 
    
  

9
Coeficiente de Variación
Es una medida de dispersión relativa que es
fácilmente comparable con otro coeficiente de
variación de otro conjunto de observaciones. El
resultado se expresa en porcentaje. Mientras
menor es el cv, menor es la dispersión de los
datos.
Población: CV= 100%
Muestra: CV= 100%
S
x



10
Ejemplo
Sueldo de los
empleados de la
compañía ABC
Sueldo de los
gerentes de la
compañía ABC
Media 2350 6890
Desv Est 655 1050
Coef Var 27,87% 15,24%

11
¿Cuando se considera que una
observación es un outliers?
Un x
i
es considerado un outliers si no
pertenece al intervalo [A,B], donde
A= Q
1
-1,5 RIC
B= Q
3
+1,5 RIC

12
MEDIDAS DE FORMA
Asimetría y Curtosis

13
Simetría y Asimetría

14
MEDIDA DE ASIMETRÍA
Distribución simétrica: Cuando su curva de frecuencia es
simétrica con respecto al centro de los datos, en este caso
=Me=Mo.

15
Distribución asimétrica positiva >Me>Mo
Distribución asimétrica negativaDistribución asimétrica negativa <Me<Mo<Me<Mo

16
Coeficiente de asimetría de Pearson
3( )
s
Me Mo
A
 
 
 
 
3( )
O
S
x mx me
a
s s

 
Poblacional
Muestral
Observación:
1.Si a
s
= 0 distribución simétrica
2. Si a
s< 0 distribución asimétrica negativa
3. Si a
s
> 0 distribución asimétrica positiva

17
Curtosis
El Coeficiente de Curtosis analiza el grado de
concentración que presentan los valores alrededor
de la zona central de la distribución.
Leptocúrtica Platicúrtica Mesocúrtica
K
u > 0,263 K
u = 0,263 K
u < 0,263
)(2)(2
1090
2575
19
13
PP
PP
DD
QQ
K
U





18
Curtosis
Se definen 3 tipos de distribuciones según su grado de curtosis:
Distribución mesocúrtica: presenta un grado de concentración
medio alrededor de los valores centrales de la variable (el mismo
que presenta una distribución normal).

Distribución leptocúrtica : presenta un elevado grado de
concentración alrededor de los valores centrales de la variable.
Distribución platicúrtica: presenta un reducido grado de
concentración alrededor de los valores centrales de la variable.

19
Diagrama de caja
Un diagrama de caja es una gráfica que describe la
distribución de un conjunto de datos tomando como
referencia los valores de los cuartiles como medida
de posición y el valor del rango intercuartil como
medida de referencia de dispersión.
3938373635343332313029282726252423222120
Resistencia
Diagrama de caja de la Resistencia

20
Diagramas de cajas
Permite:
Comparar las
medianas de dos o mas
conjuntos de datos.
Observar el tipo de
distribución de los datos
(simétrica o
asimétrica).
Determinar la
dispersión en el 50%
central de los datos.
Identificar la presencia
de valores extremos
(datos atípicos)

21
Construcción de un diagrama de caja
1.Se calcula: Q
1, Q
2 , Q
3 , RIC y 1,5RIC.
2.Se traza una línea de referencia horizontal o vertical (para la escala)
3.Se traza un rectángulo con los extremos en el primer y tercer cuartil
y se traza una recta vertical en la mediana.
4.Se dibujan los límites a 1,5 rango intercuartil de los cuartiles 1 y 3,
Se considera que los datos fuera de estos límites son atípicos. L
i
=Q
1
-(1,5)RIC; Ls=Q
3
+(1,5)RIC.
5.Las líneas antes y después de las cajas se llaman bigotes, se traza
desde los extremos de la caja hasta el mínimo y máximo dentro de
los límites inferior y superior.
6.Se marcan con un asterisco los valores fuera de los límites (valores
atípicos).
bigot
e

22
Ejemplo
Se desea analizar el consumo de gas natural en los hogares de
un distrito limeño, el gasto mensual en este combustible, en
nuevos soles de 36 hogares se muestra a continuación.
20,6 21,2 21,8 23,5 24 24,3 24,5 24,6 24,6
24,6 24,8 24,9 25 25,2 25,4 26,3 27,1 27,3
27,5 28,3 28,4 28,6 29,3 29,4 29,5 29,5 29,5
29,6 30,4 30,4 30,9 31,5 32,4 32,5 32,7 37,6
Realice un diagrama de caja con esta información. Comente el
resultado.

23
Solución
Después de ordenar los datos:
1.Cálculos: Q
1
=24,60; Q
2
= 27,40 Q
3
= 29,53
RIC = 4,93 1,5RIC = 7,395
LI = 24,60 – 7,395 = 17,205
LS = 29,53+7,395 = 36,925
2.Construcción de la escala:

24
Construcción
Trazamos la caja con los extremos en Q
1 y
Q
3 y ubicamos la mediana (Q
2)

25
Trazado de los límites
Se ubican y trazan los límites en los
puntos 17,205 y 36,925.

26
Ubicación y trazado de los bigotes
El dato más pequeño entre el límite inferior y Q
1 es
20,6
El dato más grande entre el límite superior y Q
3 es
32,7
Ubicamos estos valores y los bigotes se extienden
hasta estos puntos.

27
Valores atípicos
37, 6 es un valor atípico, pues es mayor al
valor del límite superior y se marca con un
asterisco.

28
Finalmente:

29
Ejercicio
Dos modos que usan los empleados para ir a
trabajar diariamente son el transporte público y
privado (automóvil), A continuación vemos unas
muestras de tiempos en minutos de cada modo:
Trace un diagrama de caja para cada modo y en
base a los resultados obtenidos, ¿Qué modo de
trasporte debe preferirse?, Explique sus razones.
Público2829323733 252932 4134
privado2931333234 303132 3533

30
Solución

31
Ejercicios propuestos
Resuelva los ejercicios de las páginas 107
a 109 del libro “Estadística para
Administración y Economía” de Anderson,
David R 10ª edición.
Tags