Formulario de Estadística

GerardoIgnacioBonill 3,780 views 11 slides Jun 24, 2021
Slide 1
Slide 1 of 11
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10
Slide 11
11

About This Presentation

Formulario de Estadística dirigido a tanto a jóvenes de bachillerato en México, como a estudiantes de Nivel Superior de todas las carreras que le requieran, como por ejemplo Ingeniería, Pedagogía, Psicología, etc. Contempla los temas fundamentales.


Slide Content

FORMULARIO
Alfabeto Griego y Símbolos Matemáticos

GERARDO IGNACIO BONILLA ALFONSO
Lic. En Mat. con EME. y Magíster(c) en Estadística Aplicada
DEFINICIÓN DE ESTADÍSTICA
ESTADÍSTICA: Ciencia conformada por un conjunto de procedimientos para…



NIVELES (O ESCALAS) DE MEDICIÓN DE DATOS:





NIVELES O
ESCALAS
DE
MEDICIÓN
DE DATOS
NOMINAL
(Los datos no se pueden acomodar
bajo un esquema de orden)
Ejemplo: El sexo de un grupo de personas: Femenino o
Masculino. Observa que en este caso no hay un criterio fijo
para ordenar los datos.
ORDINAL
(Estos datos presentan un orden
determinado, y la diferencia entre
dos categorías carece de sentido)
Ejemplo: Los lugares en que llegan unos corredores a la
meta. Orden determinado 1°, 2°, ..., pero la diferencia entre
dos de estos datos carece de sentido.
DE INTERVALO
(Las diferencias tienen sentido
pero no hay un punto de partida
establecido. Las razones carecen
de sentido)
Ejemplo: La temperatura tomada en alguna zona del planeta
en °F. La escala presenta un cero, pero este no indica
auscencia de temperatura. La razón entre dos temperaturas
diferentes no tiene sentido.
DE RAZÓN
(Presentan un punto de partida
establecido y las razones tienen
sentido)
Ejemplo: Distancia recorrida por un grupo de estudiantes
para llegar a la escuela. En este caso todos parten de una
distancia de 0 km, además si uno recorre 50 km para llegar a
la escuela y otro recorre 12.5 km, entonces la razón nos
indica cuántas veces es mayor la distancia recorrida por el
primero con respecto al segundo, siendo en este caso la
primera distancia 4 veces mayor que la segundo.

FORMULARIO
Alfabeto Griego y Símbolos Matemáticos

GERARDO IGNACIO BONILLA ALFONSO
Lic. En Mat. con EME. y Magíster(c) en Estadística Aplicada
MEDIDAS DE TENDENCIA CENTRAL

Datos no agrupados Datos agrupados
Media Aritmética
Poblacional

??????
??????=
∑??????
?
?
?@5
??????
=
∑??????
???????
?
?
?@5
??????


??????
?: i-ésimo dato
??????
?: Frecuencia absoluta del i-ésimo dato
??????: Número de datos
??????: Número de datos diferentes
??????=
∑??????
???????
?
?
?@5
??????


??????
?: i-ésima marca de clase
??????
?: Frecuencia de clase del i-ésimo intervalo de clase
??????: Número de datos
??????: Número de intervalos de clase

Muestral

??????
??????=
∑??????
?
?
?@5
??????
=
∑??????
???????
?
?
?@5
??????


??????
?: i-ésimo dato
??????
?: Frecuencia absoluta del i-ésimo dato
??????: Número de datos
??????: Número de datos diferentes
??????=
∑??????
???????
?
?
?@5
??????


??????
?: i-ésima marca de clase
??????
?: Frecuencia de clase del i-ésimo intervalo de clase
??????: Número de datos
??????: Número de intervalos de clase

Mediana
* Se deben
ordenar los
datos en
forma
ascendente.
a) Si ?????? (el número de datos) es impar, la
mediana ???????????? será el dato que se
encuentra a la mitad de todos.

b) Si ?????? (el número de datos) es par, la
mediana ???????????? será el promedio de los
dos datos que se localizan a la mitad
de todos.
????????????=??????+L
??????
2
−(∑??????)
??????
???????
M??????


??????: Extremo inferior (real) de la clase que contiene a la mediana
(∑??????): Suma de las frecuencias de las clases inferiores a la clase
que contiene a la mediana
??????: Número de datos
??????: Tamaño (real) del intervalo de clase que contiene a la
mediana
??????
???????: Frecuencia de la clase que contiene a la mediana

Nota: Para determinar el lugar donde se ubica la mediana, se
usa la regla
?
6
.

Moda
La moda (Mo) es el dato con mayor
frecuencia absoluta.
????????????=??????+l
??????
5
??????
5+??????
6
p??????


??????: Extremo inferior real de la clase modal
??????
5: Diferencia de la frecuencia modal con la frecuencia de la
clase inferior inmediata
??????
6: Diferencia de la frecuencia modal con la frecuencia de la
clase superior inmediata
??????: Tamaño (real) del intervalo de la clase modal


Datos no agrupados
Media
Geométrica

??????
??????=????????
?
?
?@5
?
=???????
5⋅??????
6⋅⋅⋅??????
?
?

??????
?: i-ésimo dato (debe ser positivo)
??????: Número de datos
Nota: En el área administrativa (negocios y economía) se emplea para determinar las tasas de cambio promedio, las tasas de
crecimiento promedio o tasas promedio.

FORMULARIO
Alfabeto Griego y Símbolos Matemáticos

GERARDO IGNACIO BONILLA ALFONSO
Lic. En Mat. con EME. y Magíster(c) en Estadística Aplicada

Media
Armónica

??????
??????=
1
1
??????

1
??????
?
?
?@5
=
??????

1
??????
?
?
?@5


??????
?: i-ésimo dato (todos los datos deben ser diferentes de cero)
??????: Número de datos
Nota: Se emplea usualmente como medida de tendencia central para datos consistentes en tasas de cambio.
Relación entre la media aritmética, la media
geométrica y la media armónica
??????≤??????≤??????

Reglas para determinar el número de clases ?????? a considerar, con base en el número de datos de una muestra
Regla de la Raíz
cuadrada
??????=√??????

??????: Número de datos
NOTA: ?????? se debe aproximar al menor entero mayor o igual que el valor de
?????? obtenido directamente de la fórmula.
Regla de Sturges
??????=1+3.322????????????????????????

??????: Número de datos

NOTA: El valor de k se debe redondear de la siguiente forma:
 Si el entero del resultado obtenido directamente de la fórmula es "par",
se redondea al entero siguiente más próximo.
 Si el entero del resultado obtenido directamente de la fórmula es
"impar", se redondea al entero menor o igual que ??????.

NOTA: El número de clases no debe ser menor a 5 ni mayor de 20.

Longitud del
Intervalo de Clase
??????=
??????????????????????????????
????????????.???????????? ???????????????????????????????????? ??????????????????????????????????????????????????????

El resultado se debe redondear a un número conveniente, un
poco mayor que el valor de ?????? obtenido de fórmula. Si tus
datos son enteros, se sugiere considerar al entero siguiente
más próximo al valor de ?????? obtenido directamente de la
fórmula.

MEDIDAS DE DISPERSIÓN
Rango
??????????????????????????????=??????
?−??????
5

??????
?: Dato mayor (N-ésimo dato)
??????
5: Dato menor (primer dato)


Datos no agrupados Datos agrupados
Desviación Media (o Promedio de
Desviaciones)

Poblacional

DM

????????????=
∑|??????
?−??????|
?
?@5
??????
=
∑??????
?|??????
?−??????|
?
?@5
??????

??????
?: i-ésimo dato
??????: Media aritmética de los datos
??????
?: Frecuencia absoluta del i-ésimo dato
??????: Número de datos
??????: Número de datos diferentes
????????????=
∑??????
?|??????
?−??????|
?
?@5
??????

??????
?: i-ésima marca de clase
??????: Media aritmética de los datos
??????
?: Frecuencia de clase del i-ésimo intervalo de clase
??????: Número de datos
??????: Número de intervalos de clase

Muestral

DM

????????????=
∑|??????
?−??????|
?
?@5
??????
=
∑??????
?|??????
?−??????|
?
?@5
??????

??????
?: i-ésimo dato
??????: Media aritmética de los datos
??????
?: Frecuencia absoluta del i-ésimo dato
??????: Número de datos
??????: Número de datos diferentes
????????????=
∑??????
?|??????
?−??????|
?
?@5
??????

??????
?: i-ésima marca de clase
??????: Media aritmética de los datos
??????
?: Frecuencia de clase del i-ésimo intervalo de clase
??????: Número de datos
??????: Número de intervalos de clase

FORMULARIO
Alfabeto Griego y Símbolos Matemáticos

GERARDO IGNACIO BONILLA ALFONSO
Lic. En Mat. con EME. y Magíster(c) en Estadística Aplicada


Datos no agrupados Datos agrupados
Varianza
Poblacional

??????
??????

??????
6
=
∑(??????
?−??????)
6?
?@5
??????
=
∑??????
?
(??????
?−??????)
6?
?@5
??????

??????
?: i-ésimo dato
??????: Media aritmética de los datos
??????
?: Frecuencia absoluta del i-ésimo dato
??????: Número de datos
??????: Número de datos diferentes
??????
6
=
∑??????
?
(??????
?−??????)
6?
?@5
??????

??????
?: i-ésima marca de clase
??????: Media aritmética de los datos
??????
?: Frecuencia de clase del i-ésimo intervalo de clase
??????: Número de datos
??????: Número de intervalos de clase
Muestral

??????
??????

??????
6
=
∑(??????
?−??????)
6?
?@5
??????−1
=
∑??????
?
(??????
?−??????)
6?
?@5
??????−1

??????
?: i-ésimo dato
??????: Media aritmética de los datos
??????
?: Frecuencia absoluta del i-ésimo dato
??????: Número de datos
??????: Número de datos diferentes
??????
6
=
∑??????
?
(??????
?−??????)
6?
?@5
??????−1

??????
?: i-ésima marca de clase
??????: Media aritmética de los datos
??????
?: Frecuencia de clase del i-ésimo intervalo de clase
??????: Número de datos
??????: Número de intervalos de clase


Datos no agrupados Datos agrupados
Desviación Estándar (o típica)
Poblacional

??????
?????? =?
∑(??????
?−??????)
6?
?@5
??????
=???????
6


??????
?: i-ésimo dato
??????: Media aritmética de los datos
??????: Número de datos
??????=?
∑??????
?(??????
?−??????)
6?
?@5
??????
=???????
6


??????
?: i-ésima marca de clase
??????: Media aritmética de los datos
??????
?: Frecuencia de clase del i-ésimo intervalo de clase
??????: Número de datos
??????: Número de intervalos de clase
Muestral

??????
?????? =?
∑(??????
?−??????)
6?
?@5
?????? − 1
=???????
6


??????
?: i-ésimo dato
??????: Media aritmética de los datos
??????: Número de datos
??????=?
∑??????
?(??????
?−??????)
6?
?@5
?????? − 1
=???????
6


??????
?: i-ésima marca de clase
??????: Media aritmética de los datos
??????
?: Frecuencia de clase del i-ésimo intervalo de clase
??????: Número de datos
??????: Número de intervalos de clase

Coeficiente de variabildad

????????????
Para una muestra:
???????????? =
??????
??????
100%

??????: Desviación Estándar de la muestra
??????: Media Aritmética de la muestra
Para una población:
????????????=
??????
??????
100%

??????: Desviación Estándar de la población
??????: Media Aritmética de la población

FORMULARIO
Alfabeto Griego y Símbolos Matemáticos

GERARDO IGNACIO BONILLA ALFONSO
Lic. En Mat. con EME. y Magíster(c) en Estadística Aplicada
MEDIDAS DE POSICIÓN
Cálculo de Percentiles para datos no agrupados:

FORMULARIO
Alfabeto Griego y Símbolos Matemáticos

GERARDO IGNACIO BONILLA ALFONSO
Lic. En Mat. con EME. y Magíster(c) en Estadística Aplicada
Cálculo de percentiles para datos agrupados:
k-ésimo
Percentil
??????
??????
Para datos agrupados:
??????
?= ??????
?+F
??????[??????/100]−??????
?
??????
?
G??????


??????
?: Límite real inferior de la clase que contiene al k-ésimo percentil
??????: Número de percentil a determinar
??????: Número de datos
??????
?: Frecuencia acumulada de la clase que antecede a la clase del k-ésimo percentil
??????
?: Frecuencia absoluta de la clase donde se ubica el k-ésimo percentil
??????: Ancho real del intervalo de la clase del k-ésimo percentil

Nota: Para determinar el lugar donde se ubica el percentil k, se usa la regla @
?
544
A??????.

Estadísticos que usan a los cuartiles y percentiles
Rango intercuartilar (RIC)
??????????????????=??????
7−??????
5
??????
5: Primer cuartil
??????
7: Tercer cuartil
Rango semiintercuartilar
Rango semiintercuartilar=
??????
7−??????
5
2

??????
5: Primer cuartil
??????
7: Tercer cuartil
Cuartil medio
Cuartil medio=
??????
5+??????
7
2

??????
5: Primer cuartil
??????
7: Tercer cuartil
Rango de percentiles 10 a 90
Rango de percentiles 10 a 90=??????
=4−??????
54
??????
54: Percentil 10
??????
=4: Percentil 90

FORMULARIO
Alfabeto Griego y Símbolos Matemáticos

GERARDO IGNACIO BONILLA ALFONSO
Lic. En Mat. con EME. y Magíster(c) en Estadística Aplicada
MEDIDAS DE SESGO (ASIMETRÍA)
Coeficiente
de Sesgo
????????????
Para datos no agrupados:
???????????? =
??????
(?????? − 1)(?????? − 2)
? F
??????
?− ??????
??????
G
7?
?@5

??????: Número de datos en la muestra
??????
?: i-ésimo dato
??????: Media Aritmética de la muestra
??????: Desviación estándar de la muestra
Para datos agrupados:
???????????? =
1
??????
7
F
∑??????
?(??????
?−??????)
7?
?@5
??????
G


??????: Número de datos en la muestra
??????
?: i-ésima marca de clase
??????
?: Frecuencia de la i-ésima clase
??????: Media Aritmética de la muestra
??????: Desviación estándar de la muestra
??????: Número de intervalos de clase
Valor del CS y sesgo de los datos
???????????? = ??????

Sesgo:
La distribución de los datos es
simétrica.

Nota: La media, mediana y
moda son iguales.
Gráfica típica: Distribución simétrica



???????????? > ??????

Sesgo:
La distribución de los datos
presenta sesgo a la derecha (o
sesgo positivo).

Nota: La media y la mediana se
localizan a la derecha de la
moda.
Gráfica típica: Sesgo a la derecha



???????????? < ??????

Sesgo:
La distribución de los datos
presenta sesgo a la izquierda
(o sesgo negativo).

Nota: La media y la mediana se
localizan a la izquierda de la
moda.
Gráfica típica: Sesgo a la izquierda

FORMULARIO
Alfabeto Griego y Símbolos Matemáticos

GERARDO IGNACIO BONILLA ALFONSO
Lic. En Mat. con EME. y Magíster(c) en Estadística Aplicada
MEDIDAS DE CURTOSIS (AFILAMIENTO)
Coeficiente
de Curtosis
????????????
Para datos no agrupados:
???????????? =
??????(?????? + 1)
(?????? − 1)(?????? − 2)(?????? − 3)
? H
??????
?− ??????
??????
I
8
?
?@5

3(?????? − 1)
6
(?????? − 2)(?????? − 3)


??????: Número de datos en la muestra.
??????
?: i-ésimo dato.
??????: Media Aritmética de la muestra.
??????: Desviación estándar de la muestra.
Para datos agrupados:
????????????=
1
??????
8
F
∑??????
?(??????
?−??????)
8?
?@5
??????
G


??????: Número de datos en la muestra.
??????
?: i-ésima marca de clase.
??????
?: Frecuencia de la i-ésima clase.
??????: Media Aritmética de la muestra.
??????: Desviación estándar de la muestra.
??????: Número de intervalos de clase.
Valor del CC y sesgo de los datos
???????????? = ??????

Curtosis:
La distribución de los datos es
simétrica en forma de una
curva normal estándar.
Gráfica típica: Curva Mesocúrtica



???????????? > ??????

Curtosis:
La distribución de los datos es
simétrica con un pico mayor
que en el caso de la curva
normal estándar.
Gráfica típica: Curva Leptocúrtica


???????????? < ??????

Curtosis:
La distribución de los datos es
simétrica con un pico menor
que en el caso de la curva
normal estándar.
Gráfica típica: Curva Platocúrtica

FORMULARIO
Alfabeto Griego y Símbolos Matemáticos

GERARDO IGNACIO BONILLA ALFONSO
Lic. En Mat. con EME. y Magíster(c) en Estadística Aplicada
MOMENTOS
Momentos
r-ésimo momento
de la variable
aleatoria X con
respecto a cero:

??????
??????

Si X1, X2, …, XN son N valores que toma la variable aleatoria X, entonces el
r-ésimo momento con respecto a cero se define por el número:

??????
?
=
∑??????
?
??
?@5
??????
=
??????
5
?
+ ??????
6
?
+.. .+??????
?
?
??????


Nota: Observa que el primer momento de X es igual a la media aritmética
de X.
r-ésimo momento
de la variable
aleatoria X con
respecto a la media
aritmética:

??????
??????
Si X1, X2, …, XN son N valores que toma la variable aleatoria X, entonces el
r-ésimo momento con respecto a la media aritmética se define por
el número:

??????
?=
∑k??????
?− ??????o
?
?
?@5
??????
=
k??????
5− ??????o
?
+k??????
6− ??????o
?
+.. .+k??????
?− ??????o
?
??????


Nota: Observa que el segundo momento de X con respecto a la media
aritmética de X, es igual a la varianza de X.

r-ésimo momento
de la variable
aleatoria X con
respecto a cualquier
origen A:

??????
??????
?

Si X1, X2, …, XN son N valores que toma la variable aleatoria X, entonces el
r-ésimo momento con respecto a la cualquier origen A se define por el
número:

??????
?
?
=
∑ (??????
?− ??????)
??
?@5
??????




X

FORMULARIO
Alfabeto Griego y Símbolos Matemáticos

GERARDO IGNACIO BONILLA ALFONSO
Lic. En Mat. con EME. y Magíster(c) en Estadística Aplicada
ESTADÍSTICA BIVARIADA (DOS VARIABLES ALEATORIAS)
Correlación lineal
Coeficiente de
correlación producto -
momento de Pearson

??????

Datos muestrales:
?????? =
??????∑????????????−(∑??????)(∑??????)
???????(∑??????
6
)−(∑??????)
6
???????(∑??????
6
)−(∑??????)
6


??????: Número de pares ordenados a considerar.
∑??????, ∑??????: Suma de todos los valores x y suma de todos los valores y
respectivamente.
∑??????
6
, ∑??????
6
: Suma de los cuadrados de cada x y y respectivamente.
∑????????????: Suma de todos productos de cada x con su correspondiente y
respectivamente.

Coeficiente de
correlación producto -
momento de Pearson

??????

Datos poblacionales:
?????? =
??????∑????????????−(∑??????)(∑??????)
???????(∑??????
6
)−(∑??????)
6
???????(∑??????
6
)−(∑??????)
6


??????: Número de pares ordenados a considerar.
∑??????, ∑??????: Suma de todos los valores x y suma de todos los valores y
respectivamente.
∑??????
6
, ∑??????
6
: Suma de los cuadrados de cada x y y respectivamente.
∑????????????: Suma de todos productos de cada x con su correspondiente y
respectivamente.

Propiedades del Coeficiente de Correlación Lineal de Pearson




•El Coeficiente de Correlación Lineal de Pearsones un número real que toma valores en el
intervalo [-1, 1].
1
•El Coeficiente de Correlación Lineal de Pearsones positivo si yaumenta cuando xaumenta.
•El Coeficiente de Correlación Lineal de Pearsones negativo si ydisminuye cuando xaumenta.
2
•Entre más cercano se encuentreelCoeficiente de Correlación Lineal de Pearsona -1 o 1, la
relación es más fuerte entre las variables consideradas.
•Si elCoeficiente de Correlación Lineal de Pearsones cercano a 0, entonces la relación entre las
variables es más débil.
3
•El Coeficiente de Correlación Lineal de Pearsones útil sólo en el caso que las variables presenten
correlación lineal.
4

FORMULARIO
Alfabeto Griego y Símbolos Matemáticos

GERARDO IGNACIO BONILLA ALFONSO
Lic. En Mat. con EME. y Magíster(c) en Estadística Aplicada

Regresión Lineal
Recta de regresión
(o de mínimos
cuadrados, o de mejor
ajuste)
Modelo:
??????=??????
5??????+??????
4

??????
5=
??????∑???????????? −(∑??????)(∑??????)
??????(∑??????
6
)−(∑??????)
6


??????
4=
(∑??????)(∑??????
6
)−(∑??????)(∑????????????)
??????(∑??????
6
)−(∑??????)
6


(??????
5 es la Pendiente de la recta de regresión)
(??????
4 se denomina Intercepto, y corresponde a la Ordenada al origen de la recta de
regresión, o lo que es lo mismo, la intercepción de la recta con el eje y)
Error estándar de
estimación de Y sobre
X
??????
?,?


??????
?,?=?
∑??????
6
− ??????
4∑?????? − ??????
5∑????????????
??????−2