Capítulo 11 Regressão
4. Análise do R² ajustado: se a multicolinearidade estiver presente, é possível que o R² ajus-
tado seja muito alto, o que pode indicar que o modelo está superajustado devido à duplica-
ção de efeitos das variáveis independentes.
5. Análise dos sinais e magnitude dos coeficientes: a multicolinearidade pode afetar a inter-
pretação dos coeficientes de regressão em termos de suas magnitudes e sinais. Coeficientes
de regressão com magnitudes inconsistentes ou com sinais opostos ao esperado podem ser
um indicativo de multicolinearidade.
É importante notar que a identificação da multicolinearidade não implica necessariamente
na necessidade de remoção das variáveis correlacionadas do modelo. Há várias formas para lidar
com esse problema, mas fogem um pouco do escopo deste livro. O mais importante é ter uma
análise cuidadosa do contexto do estudo e dos objetivos de pesquisa para uma interpretação ade-
quada dos resultados em presença de multicolinearidade. Ir testando combinações de variáveis a
serem implantadas no modelo pode ser uma boa saída. Pesquise também por métodos de seleção
de variáveis, como regressão Ridge e LASSO. Usar os escores dos resultados de Análise de Com-
ponentes Principais também pode ser uma solução; estamos falando aqui em redução de dimensi-
onalidade. Se a sua pesquisa necessitar desse cuidado, busque primeiramente sobre esses assuntos.
Abaixo, vamos demonstrar um caso simples de multicolinearidade. É um banco de dados
complementar ao que utilizamos mais acima, do rendimento de carcaça. Chamaremos de
“reg_mult”, você pode cria-lo ou baixar via Github da página do livro. A variável “temp_ani”
indica a temperatura corpórea do animal, em °C; “temp_amb” é a temperatura ambiente no qual o
suíno está inserido, em °C; “fluxo_vent” é o fluxo de vento que esses animais recebem como forma
de bem-estar animal; e, “carin” é a quantidade de carinho que esse animal recebe espontaneamente
de humanos ao longo do dia. Temos, portanto:
#criando banco
reg_mult <- data.frame(
idade = c(6,7,8,7,10,9,12,11,14,15,6,11,14),
carc = c(89,88,90,98,89,112,110,124,130,136,78,100,127),
temp_ani = c(37.6,38.6,39.1,38.9,39.3,38.7,39.1,39.4,39.6,40.3,37.1,39.7,40.2),
temp_amb = c(26,26.5,26.7,27,26.4,27.3,27.1,28,27.3,26.1,25.8,26.9,27.1),
fluxo_vent = c(0.2,0.3,0.1,0.3,0.1,0.2,0.3,0.1,0.2,0.1,0.1,0.3,0.2),
carin = c(7,6,8,5,3,7,2,2,1,0,6,2,1)
)
#ou importando o banco
library(rio)
reg_mult <- import('pasta_de_arquivos/reg_mult.txt')
#mudando as escalas para escore Z