Medidas de dispersion

shuacruz 25,962 views 35 slides Nov 24, 2013
Slide 1
Slide 1 of 35
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10
Slide 11
11
Slide 12
12
Slide 13
13
Slide 14
14
Slide 15
15
Slide 16
16
Slide 17
17
Slide 18
18
Slide 19
19
Slide 20
20
Slide 21
21
Slide 22
22
Slide 23
23
Slide 24
24
Slide 25
25
Slide 26
26
Slide 27
27
Slide 28
28
Slide 29
29
Slide 30
30
Slide 31
31
Slide 32
32
Slide 33
33
Slide 34
34
Slide 35
35

About This Presentation

No description available for this slideshow.


Slide Content

ESTADÍSTICA DESCRIPTIVA
Medidas de Dispersión

=
k
i
ii
fX
1

Dispersión
• La dispersión muestra la disparidad que
existe entre los valores de la variable. Si es
elevada, las medidas de posición pueden
resultar poco representativas, al ser una
muestra poco homogénea para esa variable.
Si la dispersión es baja, la representatividad
de las medidas de posición mejora, siendo
el grupo más homogéneo.

Medidas de dispersión
• Las medidas de tendencia central son valores en
una distribución y las medidas de la variabilidad
son intervalos, designan distancias o un número de
unidades en la escala de medición.
• Sólo pueden obtenerse con variables de escala de
intervalo o de razón en las que puede valorarse el
grado de representatividad de medidas de posición
como la media.

Medidas de dispersión
Pueden ser
ABSOLUTAS
Recorrido
Desviación media
Varianza
Desviación estándar
RELATIVAS
Coeficiente de apertura
Recorrido relativo
Coeficiente de variación

MEDIDAS DE DISPERSIÓN
ABSOLUTAS
• Recorrido
• Desviación media
•Varianza
• Desviación estándar

Recorrido
• Es la diferencia entre el mayor y el menor valor de
la variable:
min
x x R
Max

=

Recorrido
VENTAJAS
• Cálculo sencillo
DESVENTAJAS
• Sólo tiene en cuenta dos
valores de la serie.
• Le afecta la existencia de
valores extremos.
• No se refiere a ninguna
medida de posición central
por lo que no sirve para
valorar representatividad
de alguna de ellas.

8
DESVIACION MEDIA
n
X X
DM
i
n
i

=

=1
Desviación media
De una muestra:
n
X
DM
i
n
i
µ

=

=1
De una población:

Desviación media
• Si no se tomaran los valores absolutos de las
diferencias entre los valores de la variable y
la media el resultado sería igual a 0.
• La DM puede calcularse respecto a la
mediana y a la moda, en el caso de que la
media no sea representativa de los valores
que toma la variable.

CALCULO DE LA DESVIACION MEDIA
Caso de una Distribución de Frecuencia de Datos No Agrupados:
Ejemplo:
Un pediatra obtuvo la siguiente tabla sobre los meses de edad de 50 niños de
su consulta en el momento de empezar a caminar:

meses DM04,1
50
52
= =
µ = 12,2 meses
n = 50
n
X
DM
i
n
i
µ

=

=1
52 50
2,8 2,8 1 15
14,4 1,8 8 14
8,8 0,8 11 13
3,2 0,2 16 12
10,8 1,2 9 11
8,8 2,2 4 10
3,2 3,2 1 9
lxi-µl f
i
lx
i-µl Niños (f)
Meses
(x)
CALCULO DE LA DESVIACION MEDIA

CALCULO DE LA DESVIACION MEDIA
Caso de una Distribución de Frecuencia de Datos Agrupados:
Ejemplo:
Las alturas de los jugadores de un equipo de basquet vienen dadas por la
tabla:

CALCULO DE LA DESVIACION MEDIA
µ = 186,63 cm
n = 23
116,09 23
21,74 10,87 197,5 2 [195, 200)
29,35 5,87 192,5 5 [190, 195)
6,96 0,87 187,5 8 [185, 190)
16,52 4,13 182,5 4 [180, 185)
27,39 9,13 177,5 3 [175, 180)
14,13 14,13 172,5 1 [170, 175)
lMC
i-µl f
i
lMC
i-µl MC
Nº de
jugado
res
Altura
(cms)
n
X
DM
i
n
i
µ

=

=1
cm DM05.5
23
09,116
= =

Es una medida de dispersión que cuantifica la variabilidad de los
datos con respecto a la media aritmética y se denota por V(X).
Se define como la media aritmética de las desviaciones al
cuadrado de cada uno de los datos con respecto a la media.
Varianza
Cuando se refiere a la población se representa por σ
2
y si se refiere a la
muestra se representa como s
2
n
n x
n
x
x
n
i
i
n
i
i
2
1
2
1
2
2
) (
)(
µ µ
σ

=

=
∑ ∑
= =
Para una población
:
Para una muestra
:
n
xn x
n
x x
x s
n
i
i
n
i
i
2
1
2
1
2
2
) (
)(

=

=
∑ ∑
= =

µ = 12,2 meses
n = 50
CALCULO DE LA VARIANZA
84 50
7,84 7,84 1 15
25,92 3,24 8 14
7,04 0,64 11 13
0,64 0,04 16 12
12,96 1,44 9 11
19,36 4,84 4 10
10,24 10,24 1 9
(x
i-µ)
2
f
i
(x
i-µ)
2
Niños (f)
Meses
(x)
2 1
2
2
68,1
50
84
) (
)(meses
n
x
x
n
i
i
= =

=

=
µ
σ

µ = 12,2 meses
n = 50
CALCULO DE LA VARIANZA
7526 50
225 225 1 15
1568 196 8 14
1859 169 11 13
2304 144 16 12
1089 121 9 11
400 100 4 10
81 81 1 9
x
i
2
f
i
x
i
2
Niños (f)
Meses
(x)
68,1
50
2,12 50 7526
)(
2
2
1
2
2
=
⊗ −
=

=

=
n
n x
x
n
i
i
µ
σ

Propiedades de la Varianza
1. Nunca es negativa: el numerador incluye
diferencias al cuadrado.
2. Si se suma una constante k (positiva o negativa)
a todos los valores de la variable, la varianza no
cambia.
3. Si se multiplica por una constante k a todos los
valores de la variable, la varianza queda
multiplicada por k
2
. Si se divide por kla
varianza queda dividida por k
2
.

Varianza
• Es un concepto estadístico sumamente
importante porque muchas de las pruebas
cuantitativas se fundamentan en él.
• En general, es difícil interpretar puesto que
su magnitud se expresa en valores al
cuadrado. Para fines descriptivos se utiliza
preferentemente la desviación estándar.

Se define como la raíz cuadrada de la varianza
DesviacionStandard
Cuando se refiere a la población se representa por σy si se refiere a la
muestra se representa como s
n
n x
n
x
x
n
i
i
n
i
i
2
1
2
1
2
) (
)(
µ µ
σ

=

=
∑ ∑
= =
n
xn x
n
x x
xs
n
i
i
n
i
i
2
1
2
1
2
) (
)(

=

=
∑ ∑
= =
Para una población
:
Para una muestra
:

µ = 12,2 meses
n = 50
CALCULO DE LA DESVIACIÓN ESTÁNDAR
84 50
7,84 7,84 1 15
25,92 3,24 8 14
7,04 0,64 11 13
0,64 0,04 16 12
12,96 1,44 9 11
19,36 4,84 4 10
10,24 10,24 1 9
(x
i-µ)
2
f
i
(x
i-µ)
2
Niños (f)
Meses
(x)
meses meses
n
x
x
n
i
i
30,1 68,1
50
84
) (
)(
2 1
2
= = =

=

=
µ
σ

µ = 12,2 meses
n = 50
CALCULO DE LA DESVIACIÓN ESTÁNDAR
7526 50
225 225 1 15
1568 196 8 14
1859 169 11 13
2304 144 16 12
1089 121 9 11
400 100 4 10
81 81 1 9
x
i
2
f
i
x
i
2
Niños (f)
Meses
(x)
mes mes
n
n x
x
n
i
i
30,1 68,1
50
2,12 50 7526
)(
2
2
2
1
2
= =
⊗ −
=

=

=
µ
σ

Propiedades de la Desviación
estándar
1. Nunca es negativa, dado que se toma la raíz
positiva.
2. Si se suma una constante k (positiva o negativa)
a todos los valores de la variable, la desviación
estándar no cambia.
3. Si se multiplica por una constante k a todos los
valores de la variable, la desviación estándar
queda multiplicada por k. Si se divide por kla
desviación estándar queda dividida por k.

Desviación estándar
• Su ventaja frente a la varianza es que sus
unidades son las mismas que la variable.
Luego, puede ser comparada directamente
con la media para determinar su
representatividad.
• Se emplea con varios métodos de inferencia
estadística.

MEDIDAS DE DISPERSIÓN
RELATIVAS
•Coeficiente de apertura
•Recorrido relativo
•Coeficiente de variación

Coeficiente de Apertura
Es el cociente entre el mayor y el menor valor de la
variable. A mayor CA, mayor dispersión. Es sencillo de calcular pero le afecta la existencia de valores
extremadamente grandes y/o pequeños y no se refiere a
ninguna medida de posición central.
min
x
x
CA
Max
=

Recorrido relativo
Es el cociente entre el recorrido y la media. Es el
número de veces que el recorrido incluye a la
media. A mayor recorrido relativo, mayor
dispersión. Es sencillo de calcular y tien e en cuenta una medida de
posición central, pero le afect a la existencia de valores
extremos.
X
x x
R
Max
r
min

=

Coeficiente de variación
Es el cociente entre la desviación estándar y la media.
Es el número de veces que la desviación estándar
incluye a la media. A mayor coeficiente de
variación, mayor dispersión. Expresa si la dispersión es alta o no y el grado de
representatividad de la media. Además permite comparar
coeficientes de distintas series de datos y sus respectivos
niveles de dispersión.
X
s
CV=

28
Cálculodel Coeficientede variación
Se va a comparar la dispersión en precios anuales
de las acciones que se venden a menos de $20 y
la dispersion en los precios de aquellas que se
venden por arriba de $100. El precio medio de las
acciones que se venden a menos de $20 es de
$5.25 y la desviación estandar es de $1.52 y el
precio medio de las acciones que se negocian a
mas de $100 es de $92.50 y su desviación
estandar es de $5.28

29
29,0
25,5
52,1
1
1
1
= = =
x
s
CV
06,0
50,92
28,5
2
2
2
= = =
x
s
CV
2 1
CV CV〉

Valores del Coeficiente de variación
• Si la media es negativa, se toma su valor absoluto.
• No es posible calcularlo si la media es cero.
• Si la desviación estándar es igual a cero, no hay dispersión:
todos los valores son iguales
• Si existe poca dispersión. La media es
representativa.
• Si la dispersión serábaja si CV es cercano a
0,3 y alta si es cercano a 1. La media serábastante o poco
representativa, dependiendo del valor de CV.
• Si existe mucha dispersión. La media no es
representativa.
0= ⇒CV
3,0 0≤ ≤CV
1 3,0〈 ≤CV
1≥ CV

ASIMETRÍA
En distribuciones totalmente simétric as, la media, la mediana y la moda
coinciden, localizándose en un mismo valor. En cambio, en distribuciones
moderadamente asimétricas, la siguiente relación se mantiene
aproximadamente:
Media – Moda = 3(Media – Mediana)
Asimetría hacia la
izquierda o negativa
Asimetría hacia la
derecha o positiva
Simetría

Coeficiente de Asimetría de Pearson • Mide la desviación respecto de la simetría
expresando la diferencia entre la media y la
mediana en relación con la desviación estándar
del grupo:
• Si la asimetría es moderada:
σ
µ
Mo
P−

Si P=0, distribución simétrica
Si P>0, asimetría positiva
Si P<0, asimetría negativa
σ
µ
) (3Me
P

=

Puntuación “Z”
Las puntuaciones “Z”son transformaciones que se pueden
hacer a los valores obtenidos, con el propósito de analizar
su distancia respecto a la media, en unidades de desviación
estándar. • Una puntuación “Z”nos indica la dirección y grado en que una
observación se aleja de la media, en una escala de unidades de
desviación estándar.
• El estandarizar valores permite comparar puntuaciones de dos
distribuciones. La variable debe estar medida en una escala de
intervalos o de razón.
σ
µ

=
x
Z

Ejemplo
• La media de una distribución de frecuencias es
60 y la desviación estándar de 10. Se desea
comparar la observación de valor 50 con el resto
de la distribución:
µ= 60
σ= 10
x = 50
1
10
60 50
−=

=

=
σ
µ
x
Z
}

Podemos decir que el valor “50”estálocalizado a una
desviación estándar por debajo de la media de la distribución.

-σ-σ-σµσσσ
68.27 %
95.45 %
99.73 %
DISTRIBUCIÓN NORMAL Y
DESVIACION STANDARD
Tags