Unefectosignificativoesaquel
enelqueelvalorobtenidose
encuentraaunadistancia
considerable,entérminosde
desviacionestípicas,dela
mediaaritmética.
Unadesviacióntípicadela
medianoesunefecto
significativo.
Para algunas áreas de
investigaciónencienciasse
considera algorealmente
extraordinario cuando el
resultadoqueseobtienese
encuentraacincodesviaciones
típicasdelamedia.
Siqueremos evaluarquétan
significativoeselhechodequeOld
Goldestépordebajodelamedia,
debemossaberquetandispersos
estánlosdatos.ResultóquelosOld
Goldsedesvíandelamediaensólo
pocomásdeunadesviación
estándar(nicotina)ysedesvíandela
media en 2.2 desviaciones
estándares(alquitranes),perolas
diferenciasnosonsignificativas.
Desafortunadamente esto sería el
principio de las mentiras del
marketing
Medidas de dispersión
Desarrollo del tema
Aunque dos
diferentes
conjuntos de
datos tengan la
misma media, es
importante saber
cómo se
dispersan éstos.
1 32
Rango Varianza Desviación
Estándar
Principales
medidas
de
dispersión
4 65
Coeficiente
de variación
Índice de
Asimetría
Índice de
Curtosis
Rango (Range)
Generalidades
Es la medida de
dispersión más fácil
de calcular.
Es especialmente
útil cuando sólo
queremos analizar el
alcance de las
variaciones.
También se conoce
como amplitud o
recorrido.
Es la diferencia
entre el valor
máximo y mínimo de
un conjunto de
datos.
Rango
El ejemplo de la Bolsa de
Valores
Eldesempeño delpreciodelas
accionesenelmercadobursátilse
suelereconocerporlosrangos(al
citarlospreciosmáximosymínimos
decadasesión)yasíinterpretarqué
tantavolatilidadmanifestólaacción
enunajornadaoperiodo.Sise
comparandosacciones,sepuede
interpretarquelaacciónquetiene
mayorvariaciónesaquellaquetiene
mayorrango.
Ventajas y desventajas
Es especialmente
útil cuando se
desea saber que
tan extremos son
los límites
máximos y
mínimos de una
variable.
Se ve afectada
por valores
extremos o
atípicos (muy
grandes o muy
pequeños).
Ventajas
Desventajas
Características:
•Es la medida de
dispersión más
fácil de calcular.
•Se obtiene
mediante la
resta de los
valores máximos
y mínimos de un
conjunto de
datos.
Varianza (Variance)
Generalidades
Toma en cuenta la
dispersión que
tienen los datos
respecto de su
media.
Su resultado se
expresa en
unidades al
cuadrado.
Se representa
mediante ??????
2
(poblacional) y ??????
2
(muestral).
Para obtenerla hay
que distinguir
cuando los datos
están (o no)
agrupados.
Varianza
Varianza poblacional para datos no agrupados
Lavarianzapoblacionalparaunaserie
dedatosnoagrupada:
??????
1,??????
2,??????
3,??????
4,…,??????
??????
secalculadelasiguientemanera:
??????
2
=
σ
??????=1
??????
??????
??????−??????
2
??????
Lasdiferenciassetomanalcuadrado
paraevitarquelasumaentrepositivos
ynegativosseacero.
Lavarianzaesigualacerosiysólosi
losdatossonigualesentresí.
0
2
4
6
8
10
12
14
A B C
Varianza muestral para datos no agrupados
Lavarianzamuestralparauna
seriededatosnoagrupada:
??????
1,??????
2,??????
3,??????
4,…,??????
�
secalculadelasiguientemanera:
??????
2
=
σ
??????=1
??????
??????
??????−ҧ??????
2
�−1
Ladiferenciaconlavarianza
poblacionalesqueeldenominador
noesigualaltamañodela
muestra,sinoqueeldenominador
es�−1.
Ejemplo: Venta de seguros
Regresemos al caso de la venta de seguros, los datos son:
8, 11, 5, 14, 11, 8, 11, 16 y ??????=��.�
??????
�
=
σ
??????=�
??????
??????
??????−??????
�
??????
=
��
�
=��.��
??????
�
=
σ
??????=�
??????
??????
??????
�
??????
−??????
�
=
���
�
−��.�
�
=���−���.��=��.��
Ejemplo: Venta de seguros
Estamedidadevariaciónnotieneun
significadoprácticodebidoaqueel
resultadoobtenidoestáexpresadoen
términoscuadrados,esdecir,lavariabilidad
desegurosvendidosesde10.75seguros
cuadrados.
Por esa razón, la varianza sólo tiene sentido
lógico cuando comparamos diferentes
conjuntos de datos con la misma unidad de
medida, es decir, su interpretación es una
medida relativa en el sentido de que aquel
conjunto que tenga la mayor varianza será el
de mayor grado de dispersión.
Tipo de cambio entre el peso mexicano y el dólar
estadounidense en los años 1995 y 2000
Tipo de cambio entre el peso mexicano y el dólar
estadounidense en los años 1995 y 2000
�
�
�
=
�.����
��
=�.�����
�
�
=
�.����
��
=�.����
Varianza para datos agrupados
La varianza poblacional para una serie de datos agrupada se calcula así:
??????
2
=
σ
??????=1
??????
[??????
??????�
??????−??????
2
]
??????
La varianza muestral para una serie de datos agrupada se calcula así:
??????
2
=
σ
??????=1
??????
[??????
??????�
??????−ҧ??????
2
]
�−1
Ventas telefónicas (muestral)
??????=15.635
??????
2
=
σ
??????=1
�
[??????
??????�
??????−ҧ??????
2
]
�−1
=
693.76
24
=28.9066
La varianza es de 28.9 miles de pesos al cuadrado
Ventajas y Desventajas
Se utiliza para
comparar la
dispersión de dos o
mas conjuntos de
datos que se
encuentren
expresados en la
misma unidad.
Las unidades en las
que se expresa
normalmente no
tienen sentido
lógico.
No puede comparar
la dispersión de
conjuntos de datos
que no estén
expresados en las
mismas unidades.
Ventajas
Desventajas
Características:
•Mide la variabilidad
tomando en cuenta
el cuadrado de la
“dispersión” de los
datos respecto de
su media.
•Siempre adquiere
valores mayores o
iguales a cero.
Desviación estándar
Generalidades
Es una medida de
variabilidad de los
datos respecto de
su media.
Su resultado se
expresa en las
mismas unidades
que los datos.
Se representa
mediante ??????
(poblacional) y ??????
(muestral).
Para obtenerla hay
que distinguir
cuando los datos
están (o no)
agrupados.
Desviación
estándar
Ventas telefónicas (muestral)
??????=
σ
??????=1
�
[??????
??????�
??????−ҧ??????
2
]
�−1
=
693.76
24
=28.9066=5.3764
La desviación típica de las ventas por teléfono es de 5.3764 miles de pesos
Ventajas y Desventajas
Indica la desviación
o variabilidad que
tienen los datos
respecto de su
media en las
mismas unidades
que las de la
variable analizada.
No puede comparar
la dispersión de
conjuntos de datos
que no estén
expresados en las
mismas unidades.
Ventajas
Desventajas
Características:
•Siempre
adquiere valores
mayores o
iguales a cero.
•Se puede utilizar
para comparar
dispersión entre
distintos
conjuntos de
datos (con las
mismas
unidades).
Coeficiente de
variación
Generalidades
Señala que tan
grande es la
magnitud de la
desviación estándar.
Se representa
mediante las siglas
CV.
Mide la dispersión
en términos de
porcentajes y no en
las unidades de la
variable.
Se utiliza para
comparar la
dispersión entre
conjuntos con
distintas unidades de
medida.
Coeficiente
de variación
Los analistas de un centro financiero desean comparar el
desempeño del tipo de cambio y el porcentaje de la participación
extranjera en el mercado accionario de la Bolsa Mexicana de
Valores durante el año 2000.
Ventajas y Desventajas
Se utiliza para
comparar
conjuntos de
datos que se
expresan en las
mismas o en
distintas
unidades de
medida.
Afecta si en uno
de los
conjuntos de
mediciones sólo
existen datos
negativos y en
el otro conjunto
de datos
únicamente hay
datos positivos.
Ventajas
Desventajas
Características:
•Debemos tener
cuidado cuando
la media
aritmética se
aproxima a 0.
•Podemos arreglar
la desventaja
tomando el valor
absoluto del
denominador.
Índice de Asimetría
Generalidades
El posicionamiento
de las medidas de
tendencia central
está en función del
sesgo (+ o -).
El sesgo positivo es
cuando la media es
mayor que la
mediana y que la
moda.
El sesgo negativo es
cuando la media es
menor que la moda.
Cualquier tipo de
sesgo refleja una
“cola” alargada a la
izquierda (-) o a la
derecha (+).
Índice de
Asimetría
Índice de Asimetría
El índice de
asimetría es una
medida de
dispersión
mediante la cual
se conoce el tipo y
la magnitud de
sesgo en una
distribución de
frecuencias. Se
representa
mediante la
expresión ??????
3.
Poblacional (no
agrupados):
??????
3=
σ
??????=1
??????
??????
??????−??????
3
??????
??????
3
Muestral (no
agrupados):
??????
3=
σ
??????=1
�
??????
??????−ҧ??????
3
�−1
??????
3
Poblacional
(agrupados):
??????
3=
σ
??????=1
??????
??????
??????�
??????−??????
3
??????
??????
3
Muestral
(agrupados):
??????
3=
σ
??????=1
�
??????
??????�
??????−ҧ??????
3
�−1
??????
3
Índice de asimetría
??????
3=0
Distribución
simétrica o
insesgada.
??????
3<0
Asimétricamente
sesgada a la izquierda
(negativa): cola hacia la
izquierda y valor más
alto hacia la derecha.
??????
3>0
Asimétricamente
sesgada a la derecha
(positiva): cola hacia la
derecha y valor más
alto hacia la izquierda.
De vuelta a las ventas por teléfono:
??????
3=
σ
??????=1
�
??????
??????�
??????−ҧ??????
3
�−1
??????
3
=
453.4272
24
5.3764
3
=
18.8928
155.4084
=0.1215
Con el resultado se puede observar que el coeficiente es
cercano a cero, así la distribución se caracteriza por ser
insesgada, es decir, que la curva tiene una forma simétrica
tal que las colas tienden a ser iguales.
Índice de Curtosis
Kurtosis
Generalidades
Es una medida de
dispersión que mide la
concentración o
dispersión de los datos
alrededor de la media.
Representa el grado
de apuntamiento de
la gráfica
(puntiaguda o
aplanada).
Si es puntiaguda
entonces los datos
se acumulan cerca
de la media.
Si es muy chata,
entonces hay una
gran dispersión
entre los datos.
Índice de
Curtosis
Índice de Curtosis
??????
4=3
Distribución
mesocúrtica (ni tan
puntiaguda ni tan
aplanada).
??????
4<3
Distribución
platicúrtica(muy
plana = mayor
dispersión de los
datos).
??????
4>3
Distribución
leptocúrtica (muy
puntiaguda = menor
dispersión de los
datos).
De vuelta a las ventas por teléfono:
??????
4=
σ
??????=1
�
??????
??????�
??????−ҧ??????
4
�−1
??????
4
=
45258.7992
24
5.3764
4
=
1885.7833
835.5381
=2.2569
¿De qué manera las medidas de dispersión te dan
los elementos suficientes para afirmar o rechazar
una suposición?
Unapequeñaempresaarealizadoencuestasauna
muestrade100personasrespectoasus
preferenciassobreunodesusproductos.Para
facilitarsuanálisisdedatoshanorganizadolas
edadesdelosencuestadosendatosagrupados.
Obténlamedia,lavarianzayladesviación
estándar.
Edades f
i m
i �
??????⋅�
??????�
??????−ഥ??????�
??????−ഥ??????
�
�
??????⋅�
??????−ഥ??????
�
60 -64 12
55 -59 26
50 -54 34
45 -49 20
40 -44 8
Sumatoria
Existen diferentes conceptos
de medias de variabilidad en
matemáticas, como la
desviación media (desviación
absoluta promedio).
¿Estas variaciones del
concepto tienen una
aplicación en la estadística?
Pregunta de investigación
σ
??????=1
??????
|??????
??????−??????|
??????