República Bolivariana de Venezuela Ministerio Del Poder Popular Para la Educación Instituto Universitario de Tecnología “Antonio José De Sucre” Barquisimeto-Edo Lara Barquisimeto, 08/2014 Nayibis Mendoza C.I:18.430.020 Estadística inferencial
La Estadística descriptiva y la teoría de la Probabilidad son los pilares de La (Estadística Inferencial) con los que se va a estudiar el comportamiento global de un fenómeno. La probabilidad y los modelos de distribución junto con las técnicas descriptivas, constituyen la base de una nueva forma de interpretar la información suministrada por una parcela de la realidad que interesa investigar. En el siguiente esquema representa el tema a tratar y que será desarrollado a continuación. INFERENCIA, ESTIMACIÓN Y CONTRASTE DE HIPÓTESIS Estadística Descriptiva Probabilidad y modelos Intervalos INFERENCIA Puntual Estimación Contraste
TIPOS DE INFERENCIA .
Los métodos básicos de la estadística Inferencial son la estimación y el contraste de hipótesis, que juegan un papel fundamental en la investigación. Por tanto, algunos de los objetivos que se persiguen en este tema son: Calcular los parámetros de la distribución de medias o proporciones muéstrales de tamaño n, extraídas de una población de media y varianza conocidas. • Estimar la media o la proporción de una población a partir de la media o proporción muestral. • Utilizar distintos tamaños muéstrales para controlar la confianza y el error admitido. • Contrastar los resultados obtenidos a partir de muestras. • Visualizar gráficamente, mediante las respectivas curvas normales, las estimaciones realizadas.
Muestra Datos Numéricos Estadísticos Población En la mayoría de las investigaciones resulta imposible estudiar a todos y cada uno de los individuos de la población ya sea por el coste que supondría, o por la imposibilidad de acceder a ello. Mediante la técnica Inferencial obtendremos conclusiones para una población no observada en su totalidad, a partir de estimaciones o resúmenes numéricos efectuados sobre la base informativa extraída de una muestra de dicha población. Por tanto, el esquema que se sigue es: Describir Se extrae Genera Utilizados para obtener Estimación Contraste Parámetros Características Poblacionales
En definitiva, la idea es, a partir de una población se extrae una muestra por algunos de los métodos existentes, con la que se generan datos numéricos que se van a utilizar para generar estadísticos con los que realizar estimaciones o contrastes poblacionales. Existen dos formas de estimar parámetros: la estimación puntual y la estimación por intervalo de confianza. En la primera se busca, con base en los datos muéstrales, un único valor estimado para el parámetro. Para la segunda, se determina un intervalo dentro del cual se encuentra el valor del parámetro, con una probabilidad determinada. EL CONCEPTO ESTADÍSTICO Y DISTRIBUCIÓN MUESTRAL El objetivo de la inferencia es efectuar una generalización de los resultados de la muestra de la población, es decir, variables aleatorias asociadas al muestreo o estadísticos muéstrales. Éstos serán útiles para hacer inferencia respecto a los parámetros desconocidos de una población. Por ello se habla de distribuciones muéstrales, ya que están basados en el comportamiento de las muestras. El primer objetivo es conocer el concepto de distribución muestral de un estadístico; su comportamiento probabilístico dependerá del que tenga la variable X y del tamaño de las muestras.
Sea x 1 ....... x n , una muestra 1 aleatoria simple (m.a.s) de la variable aleatoria X, con función de distribución F , se define el estadístico T como cualquier función de la muestra que no contiene ninguna cantidad desconocida. Sea una población donde se observa la variable aleatoria X. Esta variable X, tendrá una distribución de probabilidad, que puede ser conocida o desconocida, y ciertas características o parámetros poblacionales. El problema será encontrar una función que proporcione el mejor estimador de θ. El estimador, T, del parámetro θ debe tener una distribución concentrada alrededor de θ y la varianza debe ser lo menor posible. Los estadísticos más usuales en inferencia y su distribución asociada considerando una población P sobre la que se estudia un carácter cuantitativo son: Media muestral : X = 1 n ∑ n i = 1 X i Cuasivarianza: S 2 = 1 n - 1 ∑ n i = 1 (x i - x ) 2
DISTRIBUCIONES MUÉSTRALES Una estadística muestral proveniente de una muestra aleatoria simple tiene un patrón de comportamiento (predecible) en repetidas muestras. Este patrón es llamado la distribución muestral de la estadística. Si conocemos la distribución muestral podemos hacer inferencia. Las distribuciones muéstrales adoptan diferentes formas según las estadísticas investigadas y las características de la población estudiada. DISTRIBUCIÓN MUESTRAL DE UNA PROPORCIÓN Si P representa la proporción de elementos en una población con cierta característica de interés, es decir, la proporción de “éxitos”, donde “éxito” corresponde a tener la característica. Si sacamos muestras aleatorias simples de tamaño n de la población donde la proporción de “éxitos” es P , entonces la distribución muestral de la proporción muestral tiene las siguientes propiedades: 1. El promedio de todos los valores posibles de p es igual al parámetro P . En otras palabras, p es un estimador insesgado de P .
ERROR ESTANDAR DE LA MEDIA MUESTRAL : Es la desviación estándar de las posibles medias muéstrales. El error estándar disminuye si el tamaño de la muestra aumenta. Si la población original tiene distribución normal, entonces para cualquier tamaño muestral n la distribución de la media muestral es también normal. Si la población de origen no es Normal, pero n es “suficientemente” grande la distribución de la media muestral es aproximadamente Normal
TEOREMA DEL LIMITE CENTRAL El teorema del límite central o teorema central del límite indica que, en condiciones muy generales, si S n es la suma de n variables aleatorias independientes, entonces la función de distribución de S n «se aproxima bien» a una distribución normal (también llamada distribución gaussiana, curva de Gauss o campana de Gauss). Así pues, el teorema asegura que esto ocurre cuando la suma de estas variables aleatorias e independientes es lo suficientemente grande. PROPIEDADES El teorema del límite central garantiza una distribución normal cuando n es suficientemente grande. Existen diferentes versiones del teorema, en función de las condiciones utilizadas para asegurar la convergencia. Una de las más simples establece que es suficiente que las variables que se suman sean independientes, idénticamente distribuidas, con valor esperado y varianza finitas. La aproximación entre las dos distribuciones es, en general, mayor en el centro de las mismas que en sus extremos o colas, motivo por el cual se prefiere el nombre "teorema del límite central" ("central" califica al límite, más que al teorema). Este teorema, perteneciente a la teoría de la probabilidad , encuentra aplicación en muchos campos relacionados, tales como la inferencia estadística o la teoría de renovación.
DISTRIBUCION DE PROBABILIDAD Una distribución de probabilidad indica toda la gama de valores que pueden representarse como resultado de un experimento si éste se llevase a cabo. Es decir, describe la probabilidad de que un evento se realice en el futuro, constituye una herramienta fundamental para la prospectiva, puesto que se puede diseñar un escenario de acontecimientos futuros considerando las tendencias actuales de diversos fenómenos naturales. Toda distribución de probabilidad es generada por una variable (porque puede tomar diferentes valores) aleatoria x (porque el valor tomado es totalmente al azar), y puede ser de dos tipos:
VARIABLE DISCRETA Es una variable que sólo puede tomar valores dentro de un conjunto numerable, es decir, no acepta cualquier valor sino sólo aquellos que pertenecen al conjunto. En estas variables se dan de modo inherente separaciones entre valores observables sucesivos. Dicho con más rigor, se define una variable discreta como la variable que hay entre dos valores observables (potencialmente), hay por lo menos un valor no observable (potencialmente). Como ejemplo, el número de animales en una granja (0, 1, 2, 3...). VARIABLE CONTINUA Una variable continua puede tomar un valor cualquiera dentro de un intervalo predeterminado. Y siempre entre dos valores observables va a existir un tercer valor intermedio que también podría tomar la variable continua. Una variable continua toma valores a lo largo de un continuo, esto es, en todo un intervalo de valores. Un atributo esencial de una variable continua es que, a diferencia de una variable discreta, nunca puede ser medida con exactitud; el valor observado depende en gran medida de la precisión de los instrumentos de medición. Con una variable continua hay inevitablemente un error de medida. Como ejemplo, la estatura de una persona (1.710m, 1.715m, 1.174m....)
DISTRIBUCIÓN NORMAL La distribución normal es también un caso particular de probabilidad de variable aleatoria continua, fue reconocida por primera vez por el francés Abraham de Moivre (1667-1754). Posteriormente, Carl Friedrich Gauss (1777-1855) elaboró desarrollos más profundos y formuló la ecuación de la curva; de ahí que también se le conozca, más comúnmente, como la "campana de Gauss". La distribución de una variable normal está completamente determinada por dos parámetros, su media (µ) y su desviación estándar. Con esta notación, la densidad de la normal viene dada por la ecuación: