PARAMETROS ESTADISTICOS en estadistica descriptiva

ssuserc86518 25 views 24 slides Jun 14, 2024
Slide 1
Slide 1 of 24
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10
Slide 11
11
Slide 12
12
Slide 13
13
Slide 14
14
Slide 15
15
Slide 16
16
Slide 17
17
Slide 18
18
Slide 19
19
Slide 20
20
Slide 21
21
Slide 22
22
Slide 23
23
Slide 24
24

About This Presentation

La estadistica descriptiva


Slide Content

La ESTADÍSTICA DESCRIPTIVA registra los datos en tablas y los representa en gráficos. Calcula los parámetros estadísticos (medidas de centralización y de dispersión), que describen el conjunto estudiado.

Implica la utilización de muestras para hacer inferencias sobre la población total, o sea, analizar, interpretar y llegar a conclusiones. ESTADÍSTICA INFERENCIAL Permite hacer generalizaciones precisas sobre una población a partir de una muestra. Ayuda a tomar decisiones informadas. Es importante en los negocios y la industria.

POBLACIÓN Y MUESTRA POBLACIÓN (‘ population’ ) es el conjunto sobre el que estamos interesados en obtener conclusiones (hacer inferencia). Normalmente es demasiado grande para poder abarcarlo. MUESTRA (‘ sample’ ) es un subconjunto suyo al que tenemos acceso y sobre el que realmente hacemos las observaciones (mediciones) Debería ser “representativo” Esta formado por miembros “seleccionados” de la población (individuos, unidades experimentales).

MÉTOD O DEL MUESTREO

PARÁMETRO Es una medición numérica que describe algunas características de una Población. DATO ESTADISTICO Es una medición numérica que describe algunas características de una muestra.

VARIABLES Una VARIABLE es una característica observable que varía entre los diferentes individuos de una población. La información que disponemos de cada individuo es resumida en variables . En los individuos de la población española, de uno a otro es variable : El grupo sanguíneo {A, B, AB, O}  Var. Cualitativa Su nivel de felicidad “declarado” {Deprimido, Ni fu ni fa, Muy Feliz}  Var. Ordinal El número de hijos {0,1,2,3,...}  Var. Numérica discreta La altura {1’62 ; 1’74; ...}  Var. Numérica continua

CUALITATIVAS Si sus valores ( modalidades ) no se pueden asociar naturalmente a un número (no se pueden hacer operaciones algebraicas con ellos) Nominales : Si sus valores no se pueden ordenar Sexo, Grupo Sanguíneo, Religión, Nacionalidad, Fumar (Sí/No) Ordinales : Si sus valores se pueden ordenar Mejoría a un tratamiento, Grado de satisfacción, Intensidad del dolor CUANTITATIVAS O NUMÉRICAS Si sus valores son numéricos (tiene sentido hacer operaciones algebraicas con ellos) Discretas : Si toma valores enteros Número de hijos, Número de cigarrillos, Num. de “cumpleaños” Continuas : Si entre dos valores, son posibles infinitos valores intermedios. Altura, Presión intraocular, Dosis de medicamento administrado, edad TIPOS DE VARIABLES

Es buena idea codificar las variables como números para poder procesarlas con facilidad en un ordenador. Es conveniente asignar “ etiquetas ” a los valores de las variables para recordar qué significan los códigos numéricos. Sexo (Cualit: Códigos arbitrarios) 1 = Hombre 2 = Mujer Raza (Cualit: Códigos arbitrarios) 1 = Blanca 2 = Negra,... Felicidad Ordinal: Respetar un orden al codificar. 1 = Muy feliz 2 = Bastante feliz 3 = No demasiado feliz Se pueden asignar códigos a respuestas especiales como 0 = No sabe 99 = No contesta... Estas situaciones deberán ser tenidas en cuentas en el análisis. Datos perdidos (‘missing data’)

Aunque se codifiquen como números, debemos recordar siempre el verdadero tipo de las variables y su significado cuando vayamos a usar programas de cálculo estadístico. No todo está permitido con cualquier tipo de variable.

Los posibles valores de una variable suelen denominarse modalidades . Las modalidades pueden agruparse en clases (intervalos) Edades: Menos de 20 años, de 20 a 50 años, más de 50 años Hijos: Menos de 3 hijos, De 3 a 5, 6 o más hijos Las modalidades/clases deben forman un sistema exhaustivo y excluyente Exhaustivo : No podemos olvidar ningún posible valor de la variable Mal: ¿Cuál es su color del pelo: (Rubio, Moreno)? Bien: ¿Cuál es su grupo sanguíneo? Excluyente : Nadie puede presentar dos valores simultáneos de la variable Estudio sobre el ocio Mal: De los siguientes, qué le gusta: (deporte, cine) Bien: Le gusta el deporte: (Sí, No) Bien: Le gusta el cine: (Sí, No) Mal: Cuántos hijos tiene: (Ninguno, Menos de 5, Más de 2)

PRESENTACIÓN ORDENADA DE DATOS Las Tablas de Frecuencias y las Representaciones Gráficas son dos maneras equivalentes de presentar la información. Las dos exponen ordenadamente la información recogida en una muestra. Género Frec. Hombre 4 Mujer 6

DATOS DESORDENADOS Y ORDENADOS EN TABLAS Variable: Género Modalidades: H = Hombre M = Mujer Muestra: M H H M M H M M M H equivale a HHHH MMMMMM Género Frec. Frec. relat . porcentaje Hombre 4 4/10=0,4=40% Mujer 6 6/10=0,6=60% 10=tamaño muestral

La  frecuencia absoluta  es el  número de veces  que aparece un determinado  valor  en un estudio estadístico. Se representa por  f i . La  suma de las frecuencias absolutas  es igual al número total de datos, que se representa por  N . Para indicar resumidamente estas sumas se utiliza la letra griega  Σ  (sigma mayúscula) que se lee suma o sumatoria. TABLAS DE ESTADÍSTICA La Distribución de Frecuencias o Tabla de Frecuencias es una ordenación en forma de table de los Datos Estadísticos , asignando a cada dato su frecuencia correspondiente. FRECUENCIA ABSOLUTA Es el número de veces que aparece un determinado valor en un Estudio Estadístico. Se representa por f i . La suma de las frecuencias absolutas es igual al número total de datos, que se representa por N. f 1 +f 2 +f 3 +...+ f n =N Para indicar resumidamente estas sumas se utiliza la letra griega (sigma mayúscula) que se lee suma o sumatoria.

FRECUENCIA RELATIVA La frecuencia relative es el cociente entre entre la frecuencia absoluta de un determinado valor y el número total de datos. Se puede expresar en tantos por ciento y se representa por n i . La suma de las frecuencias relativas es igual a 1. FRECUENCIA ACUMULADA La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado. Se representa por f i. FRECUENCIA RELATIVA ACUMULADA Es el cociente entre la frecuencia acumulada de un determinado valor y el número total de datos. Se puede expresar en tantos por ciento.

EJEMPLO: Durante le mes de Julio en la Sierra Norte se han registrado las siguientes temperaturas máximas: 32, 31, 28, 29, 33, 32, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29. En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en la segunda hacemos el recuento y en la tercera anotamos la frecuencia absoluta.

La  distribución de frecuencias agrupadas  o  tabla con datos agrupados  se emplea si las variables  toman un  número grande de valores  o la  variable es continua . Se  agrupan  los  valores  en  intervalos  que tengan la  misma amplitud  denominados  clases . A cada clase  se le asigna su  frecuencia correspondiente . LÍMITES DE LA CLASE:   está  delimitada  por el  límite inferior de la clase  y el  límite superior de la clase . AMPLITUD DE LA CLASE:   es la  diferencia  entre el  límite superior e inferior  de la  clase . MARCA DE CLASE: es el  punto medio  de cada  intervalo  y es el  valor  que representa a todo el intervalo  para el  cálculo  de algunos  parámetros . DISTRIBUCI ÓN DE FRECUENCIAS AGRUPADAS

CONSTRUCCIÓN DE UNA TABLA DE DATOS AGRUPADOS 3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13. Se localizan los valores menor y mayor de la distribución. En este caso son 3 y 48. Se restan y se busca un número entero un poco mayor que la diferencia y que sea divisible por el número de intervalos de queramos poner. Es conveniente que el número de intervalos oscile entre 6 y 15. En este caso, 48 - 3 = 45, incrementamos el número hasta 50 : 5 = 10 intervalos.

Se forman los intervalos teniendo presente que el límite inferior de una clase pertenece al intervalo, pero el límite superior no pertenece intervalo, se cuenta en el siguiente intervalo.

PARÁMETROS ESTADÍSTICOS Un  Parámetro Estadístico  es un  número  que se obtiene a partir de los  datos  de una  Distribución Estadística . Los  Parámetros Estadísticos  sirven para sintetizar la información dada por una tabla o por una gráfica. Hay  tres tipos de Parámetros Estadísticos : DE CENTRALIZACIÓN DE POSICIÓN DE DISPERSIÓN

PARAMETROS ESTADÍSTICOS Centralizaci ón Posición Dispersión

MEDIDAS DE CENTRALIZACIÓN Nos indican en torno a qué valor (centro) se distribuyen los datos. La  medidas de centralización  son: MEDIA ARITMÉTICA:   es el valor  promedio  de la distribución. MEDIANA:  es la  puntación  de la escala que  separa la mitad superior  de la distribución y  la inferior , es decir divide la serie de datos en  dos partes iguales . MODA:  es el  valor  que  más se repite  en una distribución.

MEDIDAS DE POSICIÓN Las  MEDIDAS DE POSICIÓN   dividen un conjunto de datos en grupos con el mismo número de individuos. Para calcular las  medidas de posición  es necesario que los  datos  estén ordenados de  menor a mayor . La  medidas de posición  son: CUARTILES :  dividen la serie de datos en  cuatro partes iguales . DECILES: dividen la serie de datos en  diez partes iguales . PERCENTILES: dividen la serie de datos en  cien partes iguales .

MEDIDAS DE DISPERSIÓN Las  MEDIDAS DE DISPERSIÓN   nos informan sobre cuánto se alejan del centro los valores de la distribución. Las  medidas de dispersión  son: RANGO O RECORRIDO : es la  diferencia  entre el  mayor  y el  menor  de los  datos  de una distribución estadística. DESVIACIÓN MEDIA:  es la  media aritmética  de los  valores absolutos  de las  desviaciones respecto a la  media . VARIANZA: es la  media aritmética  del  cuadrado de las desviaciones  respecto a la  media . DESVIACIÓN TÍPICA:   es la  raíz cuadrada  de la  varianza .