4 - Medidas de dispersión.pdf trabajo echo

katysegurasegura 227 views 74 slides Mar 12, 2024
Slide 1
Slide 1 of 74
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10
Slide 11
11
Slide 12
12
Slide 13
13
Slide 14
14
Slide 15
15
Slide 16
16
Slide 17
17
Slide 18
18
Slide 19
19
Slide 20
20
Slide 21
21
Slide 22
22
Slide 23
23
Slide 24
24
Slide 25
25
Slide 26
26
Slide 27
27
Slide 28
28
Slide 29
29
Slide 30
30
Slide 31
31
Slide 32
32
Slide 33
33
Slide 34
34
Slide 35
35
Slide 36
36
Slide 37
37
Slide 38
38
Slide 39
39
Slide 40
40
Slide 41
41
Slide 42
42
Slide 43
43
Slide 44
44
Slide 45
45
Slide 46
46
Slide 47
47
Slide 48
48
Slide 49
49
Slide 50
50
Slide 51
51
Slide 52
52
Slide 53
53
Slide 54
54
Slide 55
55
Slide 56
56
Slide 57
57
Slide 58
58
Slide 59
59
Slide 60
60
Slide 61
61
Slide 62
62
Slide 63
63
Slide 64
64
Slide 65
65
Slide 66
66
Slide 67
67
Slide 68
68
Slide 69
69
Slide 70
70
Slide 71
71
Slide 72
72
Slide 73
73
Slide 74
74

About This Presentation

trabajo echo bien presentables


Slide Content

Estadística para las
Ciencias Sociales
Unidad 4: Medidas de dispersión
M.C.M. Rodrigo Hidalgo Linares

Orden del día
●Objetivos
●Introducción
●Medidas de dispersión
●Análisis de Caso II
●Pregunta de investigación
●Conclusión(es)
●Preguntas

•Resaltarlaimportanciadelaestadísticapero
sobretododelasmatemáticas,asícomodel
buenmanejodelainformación.
•Calcularmedidasdedispersiónparadatosno
agrupadosyagrupados.
•Interpretarelsignificadodeladesviación
estándar,asícomoidentificarlasaplicaciones
deladesviaciónestándaryelcoeficientede
variación.
Objetivos

Introducción

Reader’s
Digest
vs el
Tabaco
(1952 –
Medición
de
tóxicos)

Aprovechando la
Estadística
Laconclusiónalaquellególarevista,
publicadaconcifrasdetalladas,fueque
todaslasmarcaseranvirtualmente
idénticasyquenohabíaninguna
diferenciafueracualfueralaquese
fumase.
Peroalguiensefijoenuncosa:enlas
listasdondesedetallabanlascantidades
casiidénticasdelosdistintosvenenos,
algúncigarrillodebíafiguraralfinal,y
ésteeraelOldGold.

Le
preguntaron
a 113 597
médicos de
todas las
especialidades

Lostitularesyeltextodecían
simplementequedetodoslos
cigarrillosexaminadosporla
granrevistanacional,elOldGold
eraelqueconteníamenor
cantidad de estascosas
indeseables.Seexcluyerontodas
lascifras,asícomocualquier
indicacióndequeladiferencia
fueradetanescasovalor.
¿Diferencia
significativa?

Unefectosignificativoesaquel
enelqueelvalorobtenidose
encuentraaunadistancia
considerable,entérminosde
desviacionestípicas,dela
mediaaritmética.
Unadesviacióntípicadela
medianoesunefecto
significativo.
Para algunas áreas de
investigaciónencienciasse
considera algorealmente
extraordinario cuando el
resultadoqueseobtienese
encuentraacincodesviaciones
típicasdelamedia.

Siqueremos evaluarquétan
significativoeselhechodequeOld
Goldestépordebajodelamedia,
debemossaberquetandispersos
estánlosdatos.ResultóquelosOld
Goldsedesvíandelamediaensólo
pocomásdeunadesviación
estándar(nicotina)ysedesvíandela
media en 2.2 desviaciones
estándares(alquitranes),perolas
diferenciasnosonsignificativas.
Desafortunadamente esto sería el
principio de las mentiras del
marketing

Medidas de dispersión
Desarrollo del tema

Aunque dos
diferentes
conjuntos de
datos tengan la
misma media, es
importante saber
cómo se
dispersan éstos.

1 32
Rango Varianza Desviación
Estándar
Principales
medidas
de
dispersión
4 65
Coeficiente
de variación
Índice de
Asimetría
Índice de
Curtosis

Rango (Range)
Generalidades

Es la medida de
dispersión más fácil
de calcular.
Es especialmente
útil cuando sólo
queremos analizar el
alcance de las
variaciones.
También se conoce
como amplitud o
recorrido.
Es la diferencia
entre el valor
máximo y mínimo de
un conjunto de
datos.
Rango

Seguros de “vida”
Unacompañíadesegurosdeseaconocer
lavariaciónqueexisteenlasventasde
sus8vendedoresydeesamanera
determinarlaproductividaddecadauno
deellos.Ventasenunmes:8,11,5,14,
11,8,11,16.
????????????���=????????????����á????????????��–????????????����í�??????��
=��–�=��
Elrangoes11,locualindicaunagran
dispersiónovariabilidad,yaquesería
ilógicoquesiunvendedorlogravender
16seguros,elotrosólovenda5sise
tratadelosmismosseguros.Loanterior
puedeatribuirsealaexperiencia,ala
capacitaciónoalacarteradeclientes
quecadavendedortiene.

El ejemplo de la Bolsa de
Valores
Eldesempeño delpreciodelas
accionesenelmercadobursátilse
suelereconocerporlosrangos(al
citarlospreciosmáximosymínimos
decadasesión)yasíinterpretarqué
tantavolatilidadmanifestólaacción
enunajornadaoperiodo.Sise
comparandosacciones,sepuede
interpretarquelaacciónquetiene
mayorvariaciónesaquellaquetiene
mayorrango.

Ventajas y desventajas
Es especialmente
útil cuando se
desea saber que
tan extremos son
los límites
máximos y
mínimos de una
variable.
Se ve afectada
por valores
extremos o
atípicos (muy
grandes o muy
pequeños).
Ventajas
Desventajas
Características:
•Es la medida de
dispersión más
fácil de calcular.
•Se obtiene
mediante la
resta de los
valores máximos
y mínimos de un
conjunto de
datos.

Varianza (Variance)
Generalidades

Toma en cuenta la
dispersión que
tienen los datos
respecto de su
media.
Su resultado se
expresa en
unidades al
cuadrado.
Se representa
mediante ??????
2
(poblacional) y ??????
2
(muestral).
Para obtenerla hay
que distinguir
cuando los datos
están (o no)
agrupados.
Varianza

Varianza poblacional para datos no agrupados
Lavarianzapoblacionalparaunaserie
dedatosnoagrupada:
??????
1,??????
2,??????
3,??????
4,…,??????
??????
secalculadelasiguientemanera:
??????
2
=
σ
??????=1
??????
??????
??????−??????
2
??????
Lasdiferenciassetomanalcuadrado
paraevitarquelasumaentrepositivos
ynegativosseacero.
Lavarianzaesigualacerosiysólosi
losdatossonigualesentresí.
0
2
4
6
8
10
12
14
A B C

Varianza muestral para datos no agrupados
Lavarianzamuestralparauna
seriededatosnoagrupada:
??????
1,??????
2,??????
3,??????
4,…,??????
�
secalculadelasiguientemanera:
??????
2
=
σ
??????=1
??????
??????
??????−ҧ??????
2
�−1
Ladiferenciaconlavarianza
poblacionalesqueeldenominador
noesigualaltamañodela
muestra,sinoqueeldenominador
es�−1.

Método corto de la Varianza
(no agrupados)
Lasecuacionesanterioressepueden
transformarenlassiguientes:
??????
2
=
σ
??????=1
??????
??????
??????
2
??????
−??????
2
??????
2
=
σ
??????=1
�
??????
??????
2
−�ҧ??????
�−1
Cabeseñalarqueéstasfórmulasnos
conducenalmismoresultadoquesise
hubieran empleado lasfórmulas
anteriores,siempreycuandonosehayan
omitidoalgunosdígitosenlasdistintas
operaciones.

Ejemplo: Venta de seguros
Regresemos al caso de la venta de seguros, los datos son:
8, 11, 5, 14, 11, 8, 11, 16 y ??????=��.�
??????
�
=
σ
??????=�
??????
??????
??????−??????
�
??????
=
��
�
=��.��
??????
�
=
σ
??????=�
??????
??????
??????
�
??????
−??????
�
=
���
�
−��.�
�
=���−���.��=��.��

Ejemplo: Venta de seguros
Estamedidadevariaciónnotieneun
significadoprácticodebidoaqueel
resultadoobtenidoestáexpresadoen
términoscuadrados,esdecir,lavariabilidad
desegurosvendidosesde10.75seguros
cuadrados.
Por esa razón, la varianza sólo tiene sentido
lógico cuando comparamos diferentes
conjuntos de datos con la misma unidad de
medida, es decir, su interpretación es una
medida relativa en el sentido de que aquel
conjunto que tenga la mayor varianza será el
de mayor grado de dispersión.

Tipo de cambio entre el peso mexicano y el dólar
estadounidense en los años 1995 y 2000

Tipo de cambio entre el peso mexicano y el dólar
estadounidense en los años 1995 y 2000
�
�
�
=
�.����
��
=�.�����
�
�
=
�.����
��
=�.����

Varianza, contraste y comparaciones
Estecontrastesedebealadiferenciaenlosescenarios
macroeconómicosquesevivieronduranteesosaños.
Alsermayorlavarianzadelaño1995,sereflejaunagranvolatilidad
ynerviosismoenelmercadocambiarioproducidoporunafuerte
crisiseconómicaquesevivíaeneseaño.
Enelaño2000podemosobservarqueelpesomexicanogozódeuna
granfortaleza,puessucotizaciónsemantuvomuyestableenel
transcursodelos12meses,inclusoenelmesdejunio,cuandose
presentabalarectafinaldeunprocesoelectoralenelpaís.

Varianza para datos agrupados
La varianza poblacional para una serie de datos agrupada se calcula así:
??????
2
=
σ
??????=1
??????
[??????
??????�
??????−??????
2
]
??????
La varianza muestral para una serie de datos agrupada se calcula así:
??????
2
=
σ
??????=1
??????
[??????
??????�
??????−ҧ??????
2
]
�−1

Ventas telefónicas (muestral)
Unagranempresadeventasporteléfonoquiere
conocerlavariaciónexistenteenlasventas
realizadas(enmilesdepesos)porsusoperadores.

Ventas telefónicas (muestral)
??????=15.635
??????
2
=
σ
??????=1
�
[??????
??????�
??????−ҧ??????
2
]
�−1
=
693.76
24
=28.9066
La varianza es de 28.9 miles de pesos al cuadrado

Ventajas y Desventajas
Se utiliza para
comparar la
dispersión de dos o
mas conjuntos de
datos que se
encuentren
expresados en la
misma unidad.
Las unidades en las
que se expresa
normalmente no
tienen sentido
lógico.
No puede comparar
la dispersión de
conjuntos de datos
que no estén
expresados en las
mismas unidades.
Ventajas
Desventajas
Características:
•Mide la variabilidad
tomando en cuenta
el cuadrado de la
“dispersión” de los
datos respecto de
su media.
•Siempre adquiere
valores mayores o
iguales a cero.

Desviación estándar
Generalidades

Es una medida de
variabilidad de los
datos respecto de
su media.
Su resultado se
expresa en las
mismas unidades
que los datos.
Se representa
mediante ??????
(poblacional) y ??????
(muestral).
Para obtenerla hay
que distinguir
cuando los datos
están (o no)
agrupados.
Desviación
estándar

Desviación Estándar
Datos no agrupados
Poblacional:
??????=??????
2
=
σ
??????=1
??????
??????
??????−??????
2
??????
Muestral:
??????=??????
2
=
σ
??????=1
�
??????
??????−ҧ??????
2
�−1
Datos agrupados
Poblacional:
??????=??????
2
=
σ
??????=1
??????
[??????
??????�
??????−??????
2
]
??????
Muestral:
??????=??????
2
=
σ
??????=1
�
[??????
??????�
??????−ҧ??????
2
]
�−1

Ventas telefónicas (muestral)
??????=
σ
??????=1
�
[??????
??????�
??????−ҧ??????
2
]
�−1
=
693.76
24
=28.9066=5.3764
La desviación típica de las ventas por teléfono es de 5.3764 miles de pesos

Ventajas y Desventajas
Indica la desviación
o variabilidad que
tienen los datos
respecto de su
media en las
mismas unidades
que las de la
variable analizada.
No puede comparar
la dispersión de
conjuntos de datos
que no estén
expresados en las
mismas unidades.
Ventajas
Desventajas
Características:
•Siempre
adquiere valores
mayores o
iguales a cero.
•Se puede utilizar
para comparar
dispersión entre
distintos
conjuntos de
datos (con las
mismas
unidades).

Coeficiente de
variación
Generalidades

Señala que tan
grande es la
magnitud de la
desviación estándar.
Se representa
mediante las siglas
CV.
Mide la dispersión
en términos de
porcentajes y no en
las unidades de la
variable.
Se utiliza para
comparar la
dispersión entre
conjuntos con
distintas unidades de
medida.
Coeficiente
de variación

Coeficiente de variación
Poblaciones
????????????=
??????
??????
×100%
Muestras
????????????=
??????
ҧ??????
×100%
Enelcasodequenuestrosdatosserepresentenconnúmeros
negativos,entoncesdeberemostomarcomodenominadorel
valorabsolutodelamediapoblacionaloelvalorabsolutodela
mediamuestral.
SielCVesmenoroigualal30%,significaquelamediaaritmética
esrepresentativadelconjuntodedatos,porendeelconjuntode
datoses"Homogéneo".Porelcontrario,sielCVsuperaal30%,el
promedionoserárepresentativodelconjuntodedatos(porloque
resultará"Heterogéneo").

Los analistas de un centro financiero desean comparar el
desempeño del tipo de cambio y el porcentaje de la participación
extranjera en el mercado accionario de la Bolsa Mexicana de
Valores durante el año 2000.

????????????
1=
??????
ҧ??????
×100%=
0.0183
9.44
×100%
=
0.1352
9.44
×100%=0.0143×100%=�.����%
????????????
2=
??????
ҧ??????
×100%=
2.6662
44.75
×100%
=
1.6328
44.75
×100%=0.0364×100%=�.����%
Losanalistasdeestecentro
financieropuedenconcluirqueel
mercadocambiarioduranteelaño
2000tuvomayorestabilidadque
laparticipaciónextranjeraenel
mercado accionario,puesel
coeficientedevariacióndel
primerofuede1.43%,mientras
queeldelsegundofuede3.64%.
Deestaforma,losanalistas
comparanlavariacióndedos
mercadosquetienendistintas
unidadesdemedición.

Ventajas y Desventajas
Se utiliza para
comparar
conjuntos de
datos que se
expresan en las
mismas o en
distintas
unidades de
medida.
Afecta si en uno
de los
conjuntos de
mediciones sólo
existen datos
negativos y en
el otro conjunto
de datos
únicamente hay
datos positivos.
Ventajas
Desventajas
Características:
•Debemos tener
cuidado cuando
la media
aritmética se
aproxima a 0.
•Podemos arreglar
la desventaja
tomando el valor
absoluto del
denominador.

Índice de Asimetría
Generalidades

El posicionamiento
de las medidas de
tendencia central
está en función del
sesgo (+ o -).
El sesgo positivo es
cuando la media es
mayor que la
mediana y que la
moda.
El sesgo negativo es
cuando la media es
menor que la moda.
Cualquier tipo de
sesgo refleja una
“cola” alargada a la
izquierda (-) o a la
derecha (+).
Índice de
Asimetría

Índice de Asimetría

El índice de
asimetría es una
medida de
dispersión
mediante la cual
se conoce el tipo y
la magnitud de
sesgo en una
distribución de
frecuencias. Se
representa
mediante la
expresión ??????
3.
Poblacional (no
agrupados):
??????
3=
σ
??????=1
??????
??????
??????−??????
3
??????
??????
3
Muestral (no
agrupados):
??????
3=
σ
??????=1
�
??????
??????−ҧ??????
3
�−1
??????
3
Poblacional
(agrupados):
??????
3=
σ
??????=1
??????
??????
??????�
??????−??????
3
??????
??????
3
Muestral
(agrupados):
??????
3=
σ
??????=1
�
??????
??????�
??????−ҧ??????
3
�−1
??????
3

Índice de asimetría
??????
3=0
Distribución
simétrica o
insesgada.
??????
3<0
Asimétricamente
sesgada a la izquierda
(negativa): cola hacia la
izquierda y valor más
alto hacia la derecha.
??????
3>0
Asimétricamente
sesgada a la derecha
(positiva): cola hacia la
derecha y valor más
alto hacia la izquierda.

De vuelta a las ventas por teléfono:
??????
3=
σ
??????=1
&#3627408475;
??????
??????&#3627408474;
??????−ҧ??????
3
&#3627408475;−1
??????
3
=
453.4272
24
5.3764
3
=
18.8928
155.4084
=0.1215

Con el resultado se puede observar que el coeficiente es
cercano a cero, así la distribución se caracteriza por ser
insesgada, es decir, que la curva tiene una forma simétrica
tal que las colas tienden a ser iguales.

Índice de Curtosis
Kurtosis
Generalidades

Es una medida de
dispersión que mide la
concentración o
dispersión de los datos
alrededor de la media.
Representa el grado
de apuntamiento de
la gráfica
(puntiaguda o
aplanada).
Si es puntiaguda
entonces los datos
se acumulan cerca
de la media.
Si es muy chata,
entonces hay una
gran dispersión
entre los datos.
Índice de
Curtosis

Índice de Curtosis

Índice
de
Curtosis
Poblacional (no
agrupados):
??????
4=
σ
??????=1
??????
??????
??????−??????
4
??????
??????
4
Muestral (no
agrupados):
??????
4=
σ
??????=1
&#3627408475;
??????
??????−ҧ??????
4
&#3627408475;−1
??????
4
Poblacional
(agrupados):
??????
4=
σ
??????=1
??????
??????
??????&#3627408474;
??????−??????
4
??????
??????
4
Muestral
(agrupados):
??????
4=
σ
??????=1
&#3627408475;
??????
??????&#3627408474;
??????−ҧ??????
4
&#3627408475;−1
??????
4

Índice de Curtosis
??????
4=3
Distribución
mesocúrtica (ni tan
puntiaguda ni tan
aplanada).
??????
4<3
Distribución
platicúrtica(muy
plana = mayor
dispersión de los
datos).
??????
4>3
Distribución
leptocúrtica (muy
puntiaguda = menor
dispersión de los
datos).

De vuelta a las ventas por teléfono:
??????
4=
σ
??????=1
&#3627408475;
??????
??????&#3627408474;
??????−ҧ??????
4
&#3627408475;−1
??????
4
=
45258.7992
24
5.3764
4
=
1885.7833
835.5381
=2.2569

Conelresultadosepuedeobservarqueelcoeficientees
menoratres,porloqueladistribuciónsecaracterizaporser
platicúrtica,esdecir,quelacurvatieneunaformatalquesu
apuntamientoesachatado,talycomosemuestraa
continuación:

AnálisisdeCasoII
Medidas de dispersión

AnálisisdeCasoII
Instrucciones:Paralaresolucióndelanálisisde
caso,esnecesarioasistiralaOpenClassde
Semana4yresolverelanálisisabriendoel
micrófonoenlasesión.
Deseraprobadalaparticipaciónporeldocente,
debesentregaresteformatoenelespaciode
TrabajoFinalsemana4paraobtenerlacalificación
correspondiente.

¿De qué manera las medidas de dispersión te dan
los elementos suficientes para afirmar o rechazar
una suposición?
Unapequeñaempresaarealizadoencuestasauna
muestrade100personasrespectoasus
preferenciassobreunodesusproductos.Para
facilitarsuanálisisdedatoshanorganizadolas
edadesdelosencuestadosendatosagrupados.
Obténlamedia,lavarianzayladesviación
estándar.

Edades f
i m
i &#3627408526;
??????⋅&#3627408519;
??????&#3627408526;
??????−ഥ??????&#3627408526;
??????−ഥ??????
&#3627409360;
&#3627408519;
??????⋅&#3627408526;
??????−ഥ??????
&#3627409360;
60 -64 12
55 -59 26
50 -54 34
45 -49 20
40 -44 8
Sumatoria

•Media:
•Varianza:
•DesviaciónEstándar:
•¿Cómopodemosinterpretarlosresultadosde
lavarianzaylamedia?
Unaempresarealizóunaencuestaa100personassobrelapreferenciade
unodesusproductos,dichaspersonastienenunaedadmediade_____
años.Conbaseenelloserealizóunanálisisestadísticoyseobtuvieron
medidasdedispersiónquepermitendescribirlosiguiente:
“Seobtuvounadesviaciónestándarde_____añosrespectoalamediade
_____años,ellonosindicaquelaedaddelaspersonasqueprefieren
dichoproductooscilaentre_____y_____años.”

Pregunta de
investigación

Existen diferentes conceptos
de medias de variabilidad en
matemáticas, como la
desviación media (desviación
absoluta promedio).
¿Estas variaciones del
concepto tienen una
aplicación en la estadística?
Pregunta de investigación
σ
??????=1
??????
|??????
??????−??????|
??????

Conclusión

Conclusiones
•Laestadísticaesunaherramientaparala
descripcióndedatosquenospuedenayudara
tomardecisiones.
•Lasdiferentesmedidasdedispersiónsonun
auxiliarparaaveriguarcómoestándistribuidos
losdatosalrededordelamedia.
•Existenciertosíndicesquetambiénme
puntualizansilagráficadedistribucionestiene
unaformaalargadaoachatadaounainclinación
hacialaderechaoalaizquierda.

Preguntas

Referencias y material
extra

Referencias
•Denuncian a TikTokpor publicidad engañosa.
•Curiosidades sobre los cigarros.
•Donde se vive el sabor.
•Emulador de Calculadora Casio.

Recomendaciones

Sólo la Constancia y la Decisión lo
consiguen todo