REGRESIÓN
LOGÍSTICA
DR. FREDDY TINAJEROS, MPH, PHD
DOCENTE DE POSGRADO UAGRM
REGRESIÓN LOGÍSTICA
La regresión logística resulta
útil para los casos en los que
se desea predecir la presencia o ausencia de una
característica o resultado
según los valores de un
conjunto de predictores.
Es similar a un modelo de
regresión lineal pero estáadaptado para modelos en los
que la variable dependiente es
dicotómica.
Los coeficientes de regresión
logística pueden utilizarse para
estimar el Odds Ratio de cada variable independiente del
modelo.
La regresión logística se puede
aplicar a un rango más amplio
de situaciones de investigación
que el análisis discriminante.
OBJETIVOS DE LA REGRESIÓN LOGÍSTICA
A diferencia de la regresión lineal, con
la regresión logística el objetivo es explicar o pronosticar la pertenencia a
un grupo, a partir de una variable
dependiente categórica o cualitativa,
en función de una o más variables
independientes que pueden ser tanto
cuantitativas como cualitativas.
Se trata por tanto de identificar qué
características o factores diferencian los grupos definidos por la variable
dependiente, de forma similar a como
lo hace el análisis discriminante, pero
con la ventaja de poder considerar
cualquier nivel de medición de las
variables independientes.
EJEMPLOS DE REGRESIÓN LOGÍSTICA
¿Quécaracterísticas del estilo de vida son factores de riesgo de enfermedad
cardiovascular ?
Dada una muestra de pacientes a los que se mide la situación de:
•fumador,
•dieta,
•ejercicio,
•consumo de alcohol
Se puede generar un modelo utilizando las cuatro variables de estilo de vida
para predecir la presencia o ausencia de enfermedad cardiovascular en una
muestra de pacientes.
PREDICTIVA O DE CAUSALIDAD?
Al considerar al análisis de regresión logística como técnica
destinada al análisis de una relación de dependencia, nos
referiremos fundamentalmente a ella como una técnica predictiva y
no tanto como técnica destinada a establecer relaciones de causalidad, si bien implícitamente se razone la causalidad.
Esto es, cuando diferenciamos a las variables independientes de la dependiente establecemos un
modelo explicativo donde se fijan los factores que tienden
a favorecer un efecto, a aumentar probabilidades de un
comportamiento, que se déun valor de la variable
dependiente.
DOS MODALIDADES DE REGRESION
LOGISTICA
La regresión logística multinomial en el caso más general de
querer explicar una variable cualitativa politómica.
La regresión logística binaria: cuando se pretende explicar una
característica o suceso dicotómico (estar desempleado o no, abstenerse en las elecciones o no)
REGRESIÓN LOGISTICA MULTINOMIAL
Para ello se requiere convertir la
variable en diversas variables dicotómicas ficticias, es decir,
creando tantas variables
dicotómicas (dummy) como categorías tenga la variable menos
una, la que actuaráde categoría de
referencia.
En este segundo caso se diferencia
la situación en que la variable
categórica es politómica nominal (la elección de una marca de un
producto o la filiación política) o
politómica ordinal (el nivel salarial o el grado de acuerdo sobre una
cuestión).
VARIABLES
INDEPENDIENTES
PARA RL
•Por otro lado, desde el punto de vista de las
variables independientes, éstas pueden ser
cualitativas, tanto dicotómicas como politómicas,
o cuantitativas, y se puede considerar tanto el
efecto individual de cada una como el efecto de
la interacción.
MODELO FUNCIÓN
LOGISTICA
•El modelo se formaliza a partir de
de la función logística, donde se
plantea una relación funcional,
aquíla función es la logística, una
función con forma de curva
sigmoidal:
IMPORTANCIA DE LA RELACION EXISTENTE
Con estas características generales el análisis de
regresión logística persigue cuantificar la importancia de la relación existente entre cada una de las variables
independientes (también llamadas covariables) y la
variable dependiente
Nos permite clasificar a los individuos dentro de
las categorías de la variable dependiente según la
probabilidad que tenga de pertenecer a una de ellas dada la influencia de las covariables.
REGRESION
LOGISTICA
SIMPLE Y
MULTIPLE
•La característica definida por la variable dependiente se
pretende explicar en función de una serie de variables
independientes o predictoras que nos determinan en qué
se diferencian los dos grupos.
•Si consideramos tan sólo una variable independiente
podemos hablar de regresión logística simple,
•Si consideramos dos o más variables independientes el
modelo de regresión logística es múltiple. En el contexto
de la regresión logística estas variables se denominan
también covariables.
•Como resultado del análisis se obtienen unos pesos o
coeficientes que nos miden la importancia de cada
variable independiente para diferenciar los grupos, y en
segundo término obtenemos criterios para pronosticar la
clasificación de los individuos o casos.
MODELO DE REGRESION LINEAL
•En el modelo de regresión lineal la relación entre las
variables se expresa de forma general como:
MODELO DE REGRESION LOGISTICA
BINARIA SIMPLE
•La formulación matemática de la curva
logistica en el caso de la regresión logística
binaria simple es:
REGRESIÓN
LOGISTICA
•Matemáticamente, tiene como fundamento
explicar una función sigmoidea, cuya variable
solamente puede tomar valores entre 0 y 1, a
través de una expresión que puede contemplar la
existencia de variables independientes que se
representa por una fórmula, abajo consignada.
•Gráficamente se ajusta a una curva en forma de
una S alargada
LAS RAZONES O ARGUMENTOS QUE SUSTENTAN
LA RL
Proporcionar la posibilidad de introducir como variables predictoras de la respuesta (variable
dependiente) una combinación de variables categóricas y cuantitativas.
Tomándose en cuenta los coeficientes de regresión (B) de las variables independientes
introducidas en el modelo, se puede lograr la obtención directamente de la Odds Ratio (OR) de
cada una de ellas, que se corresponde con el riesgo de tener un resultado evaluado para un determinado valor de (X), respecto al valor disminuido en una unidad (X -1).
LAS RAZONES
O
ARGUMENTOS
QUE
SUSTENTAN
LA RL
•En la RL, la variable dependiente (la que se quiere
modelar, Y) es categórica, generalmente dicotómica
(binaria), lo que constituye una situación muy frecuente y
simple de representar fenómenos en la naturaleza por
ejemplo: Si/No, Sano/Enfermo, Bueno/Malo, etc.
•Lo que se pretende mediante la RL, es expresar la
probabilidad de que un suceso ocurra como función de
ciertas variables. Si lo que se pretende modelar o predecir
se representa por Y (variable dependiente) y las k
variables independientes (explicativas y de control), se
designan por X1, X2, X3,... Xk. El modelo de RL, dará
lugar a una ecuación que permitiráestimar la probabilidad
de que ocurriráun suceso.
PROBLEMA
EJEMPLO
•En un territorio determinado, el Servicio Veterinario,
necesita evaluar la aplicación de un programa de
prevención y control contra una determinada
enfermedad en una especie animal de importancia
para la producción. Los elementos considerados son
los meses de aplicación del programa y su éxito o
fracaso; partiendo del principio de la dicotomía, se
asigna 1 cuando es favorable y 0 en caso contrario.
BASE DE DATOS
Meses de AplicaciónÉxito
2 0
4 0
5 0
6 0
7 1
8 1
9 1
100
110
121
131
150
161
170
180
191
201
211
221
231
241
251
261
271
281
REGRESIÓN LOGISTICA BINARIA SIMPLE
EN SPSS
REGRESIÓN LOGISTICA BINARIA SIMPLE
EN SPSS
REGRESIÓN LOGISTICA BINARIA SIMPLE
EN SPSS
REGRESIÓN LOGISTICA BINARIA SIMPLE
EN SPSS
CONCLUSIÓN•La regresión logística es una herramienta
poderosa, debidamente comprobada que puede
ser empleada con seguridad para la evaluación
de un programa de salud en el ejercicio de la
Medicina Veterinaria, Ciencias de la Salud,
Economia, Biología, Derecho, Pedagogía,
Psicología y otras.