10.1 Introducción La estadística se divide en DESCRIPTIVA e INFERENCIAL ESTADISTICA Prueba de Hipótesis DESCRIPTIVA INFERENCIAL Estimación
CONCEPTOS PRELIMINARES Un estimador . Es una función de los valores muestrales utilizada para estimar un parámetro de población. Una Estimación . Cuando hemos observado un valor numérico específico de nuestro estimador, nos referimos a ese valor como una estimación.
10.1.1 Tipos de estimaciones A ) Estimación puntual Un sólo número se utiliza para estimar un parámetro desconocido. Para ser útil debe de estar acompañado del error. Ejemplo : Para el próximo mes se espera que las precipitaciones sean 2.65 pulgadas con un error de 10%.
Las estimaciones puntuales (A) De la media poblacional La media muestral estima a la media poblacional m (B) De la varianza y la desviación estándar S 2 estima s 2 S estima s (C) De la proporción poblacional p P estima
BASE DE DATOS Tormenta Precipitación ( pulgadas) escorrentiaa (pulgadas) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 1.11 1.17 1.79 5.62 1.13 1.54 3.19 1.73 2.09 2.75 1.20 1.01 1.64 1.57 1.54 2.09 3.54 1.17 1.15 2.57 3.57 5.11 1.52 2.93 1.16 0.52 0.40 0.97 2.92 0.17 0.19 0.76 0.66 0.78 1.24 0.39 0.30 0.70 0.77 0.59 0.95 1.02 0.39 0.23 0.45 1.59 1.74 0.56 1.12 0.64 La tabla siguiente muestra los datos relativos a la tormenta, las precipitaciones y escorrentía sobre un rio determinado .
ESTIMACIONESPUNTUALES DE µ, 2 , P , Variable n Media D.E . Var(n) E.E . Mín Máx Mediana PRECIPITACIÓN 25 2.16 1.25 1.49 0.25 1.01 5.62 1.64
EJEMPLO La siguiente tabla proporciona datos sobre la precipitación total registrada en 11 estaciones meteorológicas de dos provincias de la región Cajamarca: Prov. A: 100 90 85 120 130 105 65 70 90 108 130 (mm) Prov. B: 120 110 95 115 140 120 70 90 108 130 132 (mm) Dar una estimación puntual de máxima verosimilitud para los parámetros: media y varianza para cada provincia. Asuma que las poblaciones tienen distribución normal . Dar una estimación de la diferencia de medias y cociente de varianzas de las precipitaciones en ambas provincias Solución
PROPIEDADES DE LOS ESTIMADORES 3. EFICIENCIA . Se dice que q ˆ 1 y q ˆ 2 dos estimadores insesgados de q , q ˆ 1 es más eficiente que q ˆ 2 si q ˆ 1 tiene menor v arianza que q ˆ 2, si: Ejemplo . Se determina la eficiencia relativa de 2 estimadores de la media poblacional : e M x = = 2 1 ˆ ˆ q q n x V 2 ) ( s = , n M V e 2 ) ( 2 ps = ER = V(Me)/V( ) x = 1.57. Por tanto la media es más eficiente que la mediana al estimar a m . ( ) ( ) 2 1 ˆ ˆ q q Var Var £ 2. CONSIST ENCIA. Se dice que un estimador es consistente si proporciona estimaciones que convergen en probabilidad hacia el parámetro poblacional que se está estudiando a medida que “n” crece. Es decir: Ejemplo . La media es un estimador consistente de m , según la l ey de los grandes números. ( ) 1 ˆ lim = £ - ¥ ® e q q P n
TIPOS DE ESTIMACIÓN Podemos hacer dos tipos de estimaciones concernientes a una población: Estimación puntual : un solo número que se utiliza para estimar un parámetro de población desconocido Estimación por intervalo : intervalo de valores utilizado para estimar un parámetro de población desconocido. Los extremos se calcula a partir de la muestra con cierto margen de confiabilidad.
Entre los principales métodos de estimación puntual se tiene: 1). El método de los momentos (en el que se iguala los correspondientes momentos poblacionales y muestrales). El método de máxima verosimilitud (que busca maximizar la probabilidad de que ocurra la muestra observada) El método de Mínimos cuadrados ordinarios MÉTODOS DE ESTIMACIÓN PUNTUAL
MÉTODO DE LOS MOMENTOS
METODO DE MAXIMA VEROSIMILITUD
Un intervalo de valores se utiliza para estimar un parámetro desconocido. El error se indica de dos manera: por la extensión del intervalo y por la probabilidad de obtener el verdadero parámetro de la población que se encuentra dentro del intervalo. Ejemplo : Para el próximo mes se espera que la precipitación pluvial pueda variar entre 500 y 600 mm, con un error de 5%. Estimación por intervalo
INTERVALOS DE CONFIANZA
Intervalo para la media µ, 2 conocida Población Normal -Z Z
INTERVALO DE CONFIANZA DEL TOTAL POBLACIONAL ( N )
Ejemplo Un analista de investigación de mercado quiere estimar el promedio del ingreso familiar mensual de una determinada población. Determine el intervalo de confianza del 95% si en una muestra aleatoria de tamaño 100 de esa población se encuentra que el promedio del ingreso familiar era de $ 500.0 Suponga que el ingreso familiar mensual se distribuye normalmente con = $ 100.0 Determine el intervalo de confianza al 95% como en (a) si se supone que la población consiste de 2000 ingresos familiares Estimar un intervalo del 95% de confianza para el total poblacional si N = 2000 y = $ 500.0 además = $ 100.0
Solución
c) Tamaño de muestra . d) Intervalo para el total poblacional
Intervalo de Confianza para una Proporción Poblacional P
Ejemplo
INTERVALO DE CONFIANZA PARA LA VARIANZA ( σ ² )
Ejemplo
Intervalo de Confianza para la Razón de 02 Varianzas
EJEMPLO 1 :
SOLUCION
Ejemplo
Ejemplo
Solución
Solución (b)
Ejemplo
EJEMPLO
Intervalo de Confianza para la diferencia entre 2 proporciones (P 1 – P2)
Ejemplo
Ajuste para poblaciones finitas El error estándar de la estimación sufre un ajuste, cuando se trata de una población finita. Error estándar de la media Error estándar de la proporción Si la proporción n/N es menor a 0,05 se omite el ajuste.
Hoja de Comprobación 1 . Se dice que un estadístico es un estimador eficiente de un parámetro si, al aumentar el tamaño de la muestra, es casi seguro que el valor del estadístico se acerque mucho al valor del parámetro. 2 . Una estimación de intervalo es un intervalo de valores utilizado para estimar la forma de la distribución de una población 3 . Si un estadístico tiende a tomar valores mayores que el parámetro de la población con la misma frecuencia con que tiende a tomar valores por debajo, decimos que el estadístico es un estimador imparcial del parámetro.
4 . La probabilidad de que un parámetro de población se encuentre dentro de una estimación de intervalo dada se conoce como nivel de confianza . 5 . Al aumentar el tamaño de la muestra, la distribución t tiende a tomar una forma más plana. 6 . Debemos utilizar siempre la distribución t, en lugar que la distribución normal , en los casos en que se desconozca la desviación estándar de la población 7 . Podemos obtener una burda estimación de la desviación estándar de una población si contamos con información acerca de su rango.
8 . Cuando se utiliza la distribución t para hacer estimaciones, se debe suponer que la población es aproximadamente normal 9 . No siempre es deseable utilizar altos niveles de confianza , debido a que estos producen grandes intervalos de confianza. 10 .Existe una distribución t distinta para cada posible tamaño de muestra. 11 .Una estimación puntual a menudo resulta insuficiente, debido a que es correcta o incorrecta.
12 . Se dice que una media de muestra es un estimador imparcial de una media de población debido a que ningún otro estimador podría extraer de la muestra información adicional acerca de la media de la población 13 .El estimador de que se utiliza con mas frecuencia es s 14 . El error estándar de la población se calcula como 15 .El numero de grados de libertad que se utilizan en una estimación de distribución t es igual al tamaño de la muestra.
16 .La distribución t es poco probable que sea aproximada por la distribución normal conforme aumenta el tamaño de la muestra. 17 .No es necesario usar la distribución t en estimación si se conoce la desviación estándar de la población 18 .La mediana de la muestra es siempre el mejor estimador de la mediana de la población 19 . Conforme aumenta el ancho de un intervalo de confianza, el nivel de confianza asociado con el intervalo también se incrementa.
20 .La estimación del error estándar de la media de una población finita utilizando la estimación de la desviación estándar de la población requiere del uso de la distribución t para calcular intervalos de confianza subsecuentes 21 .Los valores que se encuentran en la tabla de la distribución t corresponden a la probabilidad de que el parámetro real de la población se encuentre fuera de nuestro intervalo de confianza 22 .En una distribución normal , 100% de la población se encuentre fuera nuestro intervalo de confianza