CORRELACIÓN LINEAL MÚLTIPLE.pptx

2,917 views 14 slides Oct 07, 2023
Slide 1
Slide 1 of 14
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10
Slide 11
11
Slide 12
12
Slide 13
13
Slide 14
14

About This Presentation

Estadística administrativa 2


Slide Content

Integr antes: Monserrat Marin Benito Fátima Mariam Isidro Salinas Claudio César Melchor Piza Kevin Alberto Martínez Juanico Juan Carlos Herrera Baños María de los Ángeles de la Cruz Zacarías Norberto Infante García Instituto tecnológico superior de la Costa Chica 2.5. CORRELACIÓN LINEAL MÚLTIPLE “LOS DINOESTADISTICOS” Nombre de la materia: Estadística Administrativa II Docente: Ing. Gil Antonio Rojas Salinas. Fecha: 02 de octubre del 2023

¿Que es la correlación lineal múltiple ? La correlación lineal múltiple es una técnica estadística utilizada para analizar la relación entre una variable dependiente y dos o más variables independientes. Se basa en el concepto de correlación lineal simple, que mide la fuerza y dirección de la relación entre dos variables. En la correlación lineal múltiple, se busca determinar cómo las variables independientes influyen en la variable dependiente y en qué medida. Esto se logra mediante la construcción de un modelo de regresión lineal múltiple, que utiliza las variables independientes para predecir el valor de la variable dependiente.

El coeficiente de correlación lineal múltiple, también conocido como R cuadrado (R^2), indica la proporción de la variabilidad de la variable dependiente que puede ser explicada por las variables independientes en el modelo. Un valor de R^2 cercano a 1 indica que las variables independientes explican una gran parte de la variabilidad de la variable dependiente, mientras que un valor cercano a 0 indica que las variables independientes tienen poco poder predictivo.

Un modelo de regresión lineal múltiple es un modelo estadístico versátil para evaluar las relaciones entre un destino continuo y los predictores. Los predictores pueden ser campos continuos, categóricos o derivados, de modo que las relaciones no lineales también estén soportadas. El modelo es lineal porque consiste en términos de aditivos en los que cada término es un predictor que se multiplica por un coeficiente estimado. El término de constante (intercepción) también se añade normalmente al modelo.

El coeficiente de correlación más utilizado es el de Pearson, este es un índice estadístico que mide la relación lineal entre dos variables cuantitativas. El valor del coeficiente de correlación puede tomar valores desde menos uno hasta uno, -1 < r < 1, indicando que mientras más cercano a uno sea el valor del coeficiente de correlación, en cualquier dirección, más fuerte será la asociación lineal entre las dos variables. Mientras más cercano a cero sea el coeficiente de correlación, este indicará que más débil es la asociación entre ambas variables. Si es igual a cero se concluirá que no existe relación lineal alguna entre ambas variables. Coeficiente de correlacion

Hay varias maneras de equivalentes de calcular “r”, a continuación se muestran tres formas. Coeficiente Correlación Fórmula por Covarianzas y Desviaciones Típicas Siendo: “σXY” la covarianza de (X,Y) y “σX, σY” las desviaciones típicas de las distribuciones de las variables independiente y dependiente respectivamente. Coeficiente Correlación Fórmula Clásica Poco usada para calculo

Coeficiente Correlación, Fórmula por suma de cuadrados. Se usa cuando se dispone de calculadoras de mano que hacen sumas de cuadrados y no correlación.

Aplicación de la correlación lineal múltiple La correlación lineal múltiple tiene dos aplicaciones hidrológicas básicas: (1) ampliar registros cortos con base en series largas cercanas, y (2) deducir ecuaciones empíricas que permiten estimar, en sitios de interés sin aforos, crecientes de diseño Como ambas aplicaciones se realizan en un contexto regional, siempre está presente la multicolinealidad en el primer caso, y la falta de homocedasticidad en el segundo. Para corregir la no uniformidad que tienen las varianzas de la variable dependiente (Yi) se usa una función de ponderado (wi) en el ajuste de mínimos cuadrados, lo cual conduce a la técnica de mínimos cuadrados ponderados (MCP).

FÓRMULA La regresión lineal múltiple es una técnica estadística utilizada para analizar la relación entre una variable dependiente y dos o más variables independientes. La fórmula para la regresión lineal múltiple es: y = b0 + b1x1 + b2x2 + … + bnxn + e Donde: y es la variable dependiente b0 es la intersección b1, b2, …, bn son los coeficientes de las variables independientes x1, x2, …, xn e es el error aleatorio

Coeficiente de regresión múltiple y 2 R múltiple. Se define el coeficiente de regresión múltiple como la correlación existente entre la variable criterio –Y- y el conjunto de las variables predictoras contempladas en el modelo. A diferencia del coeficiente de correlación simple, el coeficiente de correlación múltiple es siempre positivo por lo que la naturaleza de la relación de cada predictor (positiva o negativa) con la variable criterio no se refleja en el resultado. Si queremos conocer el signo que determina la relación de cada variable predictora con el criterio debemos identificar el signo que acompaña a su coeficiente de regresión particular en la ecuación de regresión múltiple o calcular su coeficiente de correlación simple (bivariado) con la variable criterio

El cuadrado del coeficiente de correlación múltiple representa la proporción de la variabilidad de Y explicada por el conjunto de las Xs, es decir por el componente explicativo, conocido o determinista del modelo. Como complemento, 1- 2 R constituye como sabemos la proporción de variación no explicada o residual atribuida al efecto de factores aleatorios y desconocidos, ajenos a las variables predictoras analizadas . Coeficiente de regresión múltiple y 2 R múltiple.

Coeficiente de regresión múltiple y 2 R múltiple. Tal y como sabemos -y también para el modelo de regresión múltiple-:

Coeficiente de regresión múltiple y 2 R múltiple. es decir, la proporción que de la variabilidad de los datos de Y respecto a su media (variabilidad total –en el denominador-) se atribuye a la regresión (variabilidad explicada –en el numerador-). Entonces la proporción de variación no explicada es: