Formulario básico de estadística descriptiva

12,359 views 4 slides Jun 10, 2016
Slide 1
Slide 1 of 4
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4

About This Presentation

Formulario básico para resolver problemas de estadística descriptiva. Medidas de tendencia central y de dispersión.


Slide Content

ELABORÓ: PROFA. DALIA QUIROZ MARTINEZ 1

FORMULARIO BÁSICO DE ESTADÍSTICA DESCRIPTIVA
Medidas de Tendencia Central: Para datos NO agrupados.
Donde:
X: Media o promedio Mo: Moda (Dato que mayor frecuencia tiene es decir el que
∑: Sumatoria de todos los datos más veces se repite).
??????
�:Datos que se tienen Mdn: Mediana (Dato que se encuentra a la mitad, previamente
n: número total de datos acomodando los datos en forma creciente, si el número
de datos es par entonces los dos que quedan en medio
se suman y dividen entre 2)
Para formar los intervalos:
1. Deteerminar el número de clases (renglones)
Con la Regla de Sturges:
�=3.3log(�)+1 (No se redondea se deja en el entero que sale)

2. Determinar el rango
Xmáx – Xmín (dato mayor – dato menor)

3. Obtener la amplitud (qué tanto se va contar del límite inferior al superior)
??????=
�??????���
??????�.�� ��????????????�??????


Medidas de Tendencia Central: Para datos agrupados. (Cuando hay intervalos)
Media: Donde:
=
∑(??????
��
�)
�
: media
∑: Sumatoria
??????
�:Datos (marca de clase:
??????
�+????????????
2
, dado un intervalo: �
�−�
??????)
??????
�: Frecuencia
n: número total de datos (el que se suma de toda la frecuencia ??????
�)
Mediana:
�??????�=�
�+[
�
2
−�
??????
�
??????
]?????? Mdn: Mediana
�
�: Límite real inferior del renglón que si se está trabajando (cuando se hace el “8” con
Los extremos de los límites).
n: número total de datos
??????
??????: frecuencia acumulada anterior al renglón que si se está trabajando
??????
�: frecuencia del renglón que se está trabajando
I: Intervalo (Diferencia en forma vertical tomando cualquier par de los intervalos)
Nota: para saber con qué renglón se va a trabajar la mediana se saca la clase mediana:
�
2
y este valor se busca es
la frecuencia acumulada (donde quepa) y ese es el renglón con el que se va a trabajar.

Moda:
��= �
�+[

1

1+∆
2
]?????? Mo: Moda (la clase que mayor frecuencia tiene)
�
�: Límite real inferior del renglón que si se está trabajando (cuando se hace el “8”
Los extremos de los límites).

1: frecuencia mayor – frecuencia anterior

2: frecuencia mayor – frecuencia siguiente
Nota: Si la clase modal coincide con la clase mediana (es decir en el mismo renglón) el �
� será el mismo. El intervalo
(I) no cambia es el mismo en ambos casos.

ELABORÓ: PROFA. DALIA QUIROZ MARTINEZ 2

Tipos de Sesgo










Medidas de posición
Las medidas de posición son los deciles (D), cuartiles (Q) y percentiles (P).


 Los deciles van de 10 en 10, los cuartiles de 25 en 25 y lo percentiles de 1 en 1. Como el total de los datos
es el 100%, entonces hay 10 deciles (10%...90%), 4 cuartiles (25%, 50% y 75%) y 100 percentiles (1%...99%)

Para conocer la posición del decil, cuartil o percentil:

�
1=
�(�+1)
4
Q: cuartil
�
1=
�(�+1)
10
i: Número del decil, cuartil o percentil (el decil se toma como un solo dígito por ejemplo
�
1=
�(�+1)
100
si el decil es 40 se toma como 4, el percentil si se toma completo, y el decil si el 1
Corresponde al 25%, si es el 2 al 50% y si es el 3 al 75%)
n: número de datos.

 Una vez que se conoce la posición se ubica el renglón dónde va a “caer” con respecto a la frecuencia
acumulada.

Cuartil
�
1=�
�+[
??????
�−�
??????
�
??????
]??????


Decil
�
1=�
�+[
??????
�−�
??????
�
??????
]??????


Percentil
�
1=�
�+[
??????
�−�
??????
�
??????
]??????




Sesgo +
Sesgo -
La moda es la
línea más alta.
Las fórmulas son idénticas a la de la mediana sólo
cambia �
� que es el valor de la posición que se
obtuvo anteriormente (con la fórmula para
obtener la posición).

ELABORÓ: PROFA. DALIA QUIROZ MARTINEZ 3

Medidas de Dispersión o Variabilidad (Para una muestra)
Para dataos No agrupados:

Varianza: Donde:
??????
2
=
∑(??????
�−)
2
�−1
??????
2
: Varianza
??????
�: Dato
: Media o promedio

Desviación estándar:
Es la raíz cuadrada de la varianza.
??????=√??????
2
S: Desviación estándar

Coeficiente de variación:
�??????=
�
(100) CV: Coeficiente de variación
S: Desviación estándar
: Media o promedio

Índice de Asimetría
??????
3=
[
∑(??????
�
−)
3
�−1
]
�
3
??????
3: índice de asimetría
??????
3
: Desviación estándar al cubo

Tipo de Sesgo:








Índice de Curtosis

??????
4=
[
∑(??????
�
−)
4
�−1
]
�
4
??????
4: Índice de curtosis
??????
4
: Desviación estándar a la cuarta






??????
3>0 Positivo
??????
3=0 Simétrica
??????
3<0 Negativo
??????
4>3 ??????
4=3 ??????
4<3

ELABORÓ: PROFA. DALIA QUIROZ MARTINEZ 4

Las fórmulas para una población de las medidas de dispersión son exactamente iguales a las de la muestra
sólo cambia:

En muestra En población
Media ??????
No. de datos n – 1 N
Varianza ??????
2
??????
2

Desv. Estándar ?????? ??????

Por lo tanto:
Varianza: Desv. Estándar Índice de asimetría Índice de curtosis
??????
2
=
∑(??????
&#3627408470;−??????)
2
??????
??????=√??????
2
??????
3=
[
∑(??????
&#3627408470;
−??????)
3
??????
]
??????
3
??????
4=
[
∑(??????
&#3627408470;
−??????)
4
??????
]
??????
4


Regla empírica








??????
??????






??????

 ¡La regla empírica sólo es para éstos valores!!

Medidas de Dispersión para datos Agrupados (Con Intervalos)

Dado que hay un intervalo el dato que se toma como “X” es el de la marca de clase o sea el punto medio de cada
intervalo: &#3627408474;
&#3627408471;.

Varianza: Desv. Estándar: Coef. De Var. Índice de asimetría Índice de curtosis
??????
2
=
∑[(&#3627408474;
&#3627408471;−)
2
&#3627408467;
&#3627408470;
]
&#3627408475;−1
??????=√??????
2
&#3627408438;??????=
&#3627408454;
(100) ??????
3=
[
∑(&#3627408474;
&#3627408471;
−)
3
??????
&#3627408470;
&#3627408475;−1
]
&#3627408454;
3
??????
4=
[
∑(&#3627408474;
&#3627408471;
−)
4
??????
&#3627408470;
&#3627408475;−1
]
&#3627408454;
4


&#3627408474;
&#3627408470;: marca de clase (
??????&#3627408470;+????????????
2
)
??????
&#3627408470;: frecuencia
: media o promedio


68%
16%
16%
%&
%
Margen de error
??????+1?????? ??????−1??????
95%
??????+2?????? ??????−2??????
2.5%
2.5%
Margen de error
99%
0.5% 0.5%
??????+3?????? ??????−3??????
Margen de error
Tags