Ap 6 Correlação Linear.pdf

HelcioSuguiyama2 131 views 156 slides Nov 01, 2022
Slide 1
Slide 1 of 156
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10
Slide 11
11
Slide 12
12
Slide 13
13
Slide 14
14
Slide 15
15
Slide 16
16
Slide 17
17
Slide 18
18
Slide 19
19
Slide 20
20
Slide 21
21
Slide 22
22
Slide 23
23
Slide 24
24
Slide 25
25
Slide 26
26
Slide 27
27
Slide 28
28
Slide 29
29
Slide 30
30
Slide 31
31
Slide 32
32
Slide 33
33
Slide 34
34
Slide 35
35
Slide 36
36
Slide 37
37
Slide 38
38
Slide 39
39
Slide 40
40
Slide 41
41
Slide 42
42
Slide 43
43
Slide 44
44
Slide 45
45
Slide 46
46
Slide 47
47
Slide 48
48
Slide 49
49
Slide 50
50
Slide 51
51
Slide 52
52
Slide 53
53
Slide 54
54
Slide 55
55
Slide 56
56
Slide 57
57
Slide 58
58
Slide 59
59
Slide 60
60
Slide 61
61
Slide 62
62
Slide 63
63
Slide 64
64
Slide 65
65
Slide 66
66
Slide 67
67
Slide 68
68
Slide 69
69
Slide 70
70
Slide 71
71
Slide 72
72
Slide 73
73
Slide 74
74
Slide 75
75
Slide 76
76
Slide 77
77
Slide 78
78
Slide 79
79
Slide 80
80
Slide 81
81
Slide 82
82
Slide 83
83
Slide 84
84
Slide 85
85
Slide 86
86
Slide 87
87
Slide 88
88
Slide 89
89
Slide 90
90
Slide 91
91
Slide 92
92
Slide 93
93
Slide 94
94
Slide 95
95
Slide 96
96
Slide 97
97
Slide 98
98
Slide 99
99
Slide 100
100
Slide 101
101
Slide 102
102
Slide 103
103
Slide 104
104
Slide 105
105
Slide 106
106
Slide 107
107
Slide 108
108
Slide 109
109
Slide 110
110
Slide 111
111
Slide 112
112
Slide 113
113
Slide 114
114
Slide 115
115
Slide 116
116
Slide 117
117
Slide 118
118
Slide 119
119
Slide 120
120
Slide 121
121
Slide 122
122
Slide 123
123
Slide 124
124
Slide 125
125
Slide 126
126
Slide 127
127
Slide 128
128
Slide 129
129
Slide 130
130
Slide 131
131
Slide 132
132
Slide 133
133
Slide 134
134
Slide 135
135
Slide 136
136
Slide 137
137
Slide 138
138
Slide 139
139
Slide 140
140
Slide 141
141
Slide 142
142
Slide 143
143
Slide 144
144
Slide 145
145
Slide 146
146
Slide 147
147
Slide 148
148
Slide 149
149
Slide 150
150
Slide 151
151
Slide 152
152
Slide 153
153
Slide 154
154
Slide 155
155
Slide 156
156

About This Presentation

correlação linear estatística


Slide Content

CORRELAÇÃO LINEAR
Prof. Carlos
Henrique

Prof. Carlos Henrique
As correlações podem ser:
a) direta – ocorre com dois experimentos que variam no
mesmo sentido. Se aumentarmos
ou diminuirmos um deles, o outro também aumentará ou
diminuirá;
b) inversa – ocorre com dois fenômenos que variam em
sentido contrário. Se
aumentarmos ou diminuirmos um deles, acontecerá o
inverso com o outro, ou seja, diminuirá ou
aumentará;

Prof. Carlos Henrique

c) Correlação nula – quando não existe correlação, ou
seja, as variáveis são independentes
e) Correlação não linear – há uma correlação, porém ela
não ela não é linear

Prof. Carlos Henrique
Correlação DIRETA

Prof. Carlos Henrique
Correlação Inversa

Prof. Carlos Henrique
Correlação Nula

Prof. Carlos Henrique
Correlação Não-Linear

REGRESSÃO LINEAR SIMPLES
Prof. Carlos
Henrique

Prof. Carlos Henrique
FUNÇÃO DO PRIMEIRO GRAU

Prof. Carlos Henrique
FUNÇÃO DO PRIMEIRO GRAU

Prof. Carlos Henrique
FUNÇÃO DO PRIMEIRO GRAU

Prof. Carlos Henrique
FUNÇÃO DO PRIMEIRO GRAU

Prof. Carlos Henrique
Regressão Linear Simples

Prof. Carlos Henrique
O termo � + ��?????? é o componente de �?????? que varia
linearmente, de acordo com �?????? . Por sua vez, ???????????? é o
componente aleatório de �?????? que descreve os erros (ou
desvios) cometidos quando tentamos aproximar uma
série de observações �?????? por meio de uma reta �??????.
Nesse modelo, �?????? é a variável cujo comportamento
desejamos prever ou explicar, sendo chamada de variável
dependente ou resposta. Por outro lado, a variável �?????? é
utilizada para explicar o comportamento de �?????? , sendo
conhecida como independente, regressora, explanatória
ou explicativa.

Prof. Carlos Henrique
Regressão Linear Simples
O modelo de regressão linear requer que sejam atendidos
alguns pressupostos básicos quanto à variável aleatória ???????????? (erro
ou desvio):

i) ??????(????????????) = ??????. A média dos erros é igual a zero. Ou seja, os desvios
"para cima da reta" igualam o valor dos desvios "para baixo
da reta" na média.

Prof. Carlos Henrique
MÉTODO DOS MÍNIMOS
QUADRADOS

Prof. Carlos Henrique
Covariância

Covariância é a média do produtos dos desvios em relação à
média aritmética

Ou

Covariância é a média dos produtos menos o produto das
médias.

Prof. Carlos Henrique
COEFICIENTE ANGULAR

Prof. Carlos Henrique
COEFICIENTE LINEAR

Prof. Carlos Henrique
COEFICIENTE ANGULAR

Prof. Carlos Henrique
Regressão Linear Simples

Prof. Carlos Henrique
Regressão Linear Simples
Se a estimativa do coeficiente angular da reta obtida por meio
do método dos mínimos quadrados foi de 1,8, calcule a
previsão do faturamento em um determinado ano, uma vez
que a empresa gastou com propaganda neste ano 2 milhões de
reais

Prof. Carlos Henrique
Regressão Linear Simples

Prof. Carlos Henrique
Regressão Linear Simples

Prof. Carlos Henrique
Regressão Linear Simples

Prof. Carlos Henrique
Regressão Linear Simples

Prof. Carlos Henrique

Prof. Carlos Henrique
Regressão Linear Simples

Prof. Carlos Henrique
Regressão Linear Simples

Prof. Carlos Henrique
Regressão Linear Simples

Prof. Carlos Henrique
Atenção: Para responder à questão considere um estudo
com o objetivo de obter a relação entre duas variáveis X e Y
por meio do modelo Yi = α + βXi + ∈i, em que i corresponde
à i-ésima observação de X e Y. Os parâmetros α e β são
desconhecidos e ∈i é o erro aleatório com as respectivas
hipóteses consideradas para a regressão linear simples. Com
base em 20 pares de observações (Xi , Yi), i = 1, 2, ..., 20 e
utilizando o método dos mínimos quadrados foram obtidas
as estimativas para α e β.

Prof. Carlos Henrique
Regressão Linear Simples

Prof. Carlos Henrique

Considerando a equação da reta obtida pelo método
dos mínimos quadrados, tem-se que o valor para X
tal que Y = 15 é
(A) 6,0.
(B) 10,5.
(C) 9,0.
(D) 7,5.
(E) 12,0.

Prof. Carlos Henrique
Regressão Linear Simples

Prof. Carlos Henrique
Regressão Linear Simples
Uma empresa fabricante de produtos farmacêuticos, empregando alta tecnologia,
realizou um levantamento do custo total de um de seus produtos (Y), expresso em mil
reais, em função do número total de comprimidos produzidos (X), expresso em
unidades, durante 25 meses, com o objetivo de montar uma regressão linear simples
entre essas variáveis. Observe os seguintes resultados:

Prof. Carlos Henrique
Regressão Linear Simples

Calcule a reta que melhor se ajusta a esses dados no sentido de minimizar o
quadrado da diferença entre os valores observados e os estimados.

Prof. Carlos Henrique
Coeficiente de Correlação Linear de
Pearson

Prof. Carlos Henrique
COEFICIENTE DE CORRELAÇÃO
LINEAR DE PEARSON

Prof. Carlos Henrique
Coeficiente de Correlação Linear de
Pearson

Prof. Carlos Henrique
Coeficiente de Determinação

Prof. Carlos Henrique
Intervalo do coeficiente de Correlação
Linear de Pearson e do coeficiente de
determinação

Prof. Carlos Henrique
Correlação Linear

Prof. Carlos Henrique
Correlação Linear

Prof. Carlos Henrique
Correlação Linear

Prof. Carlos Henrique
Correlação Linear

Prof. Carlos Henrique
Correlação Linear

Prof. Carlos Henrique
Correlação Linear

Prof. Carlos Henrique
Correlação Linear
Sejam X e Y duas variáveis aleatórias e
Julgue os itens seguintes

Var(X) = E(X
2
) + [E(X)]
2


E(XY) = Cov(X,Y) + E(X) · E(Y)

E(2X + 3) = 2E(X)

Se Cov(X,Y) = 0 então X e Y são independentes.

Prof. Carlos Henrique
Correlação Linear

E(X + Y) = E(X) + E(Y) somente no caso de X e Y serem
independentes.

E(2X + 5) = 4E(X)

Var(X + 10) = Var(X) + 10

Cov(X,Y) = Var(X) · Var(Y)

E(3X + 2Y) = 9E(X) + 4E(Y)

Prof. Carlos Henrique
Correlação Linear

Prof. Carlos Henrique
Propriedades da Covariância

Prof. Carlos Henrique
Propriedades da Covariância

Prof. Carlos Henrique
Propriedades do Coeficiente da
Correlação Linear

Prof. Carlos Henrique

Prof. Carlos Henrique

Prof. Carlos Henrique

Prof. Carlos Henrique
Sejam X, Y e Z três variáveis com correlações de Pearson
expressas pela matriz abaixo:

Prof. Carlos Henrique
Correlação Linear
Julgue os itens seguintes:

X e Z são independentes.

a correlação entre X e Y é negativa.

a correlação entre V = a + bX e W = c + dZ, com
a ≠ 0, c ≠ 0, b > 0 e d < 0 é negativa.

a covariância entre X e Y é igual a 0,64.

Prof. Carlos Henrique
Correlação Linear

Prof. Carlos Henrique
Correlação Linear

Prof. Carlos Henrique
Correlação Linear
Duas variáveis aleatórias x e y têm coeficiente de correlação linear
igual a 0,8. Se w e z são tais que w = 2x – 3 e z = 4 – 2y então o
coeficiente de correlação entre w e z será igual a:
(A) –0,8.
(C) 0,36.
(B) –0,64.
(D) 0,64.
(E) 0,8.

Prof. Carlos Henrique

Prof. Carlos Henrique
VARIÂNCIA DA SOMA OU DA
DIFERENÇA DE DUAS VARIÁVEIS

Prof. Carlos Henrique

Prof. Carlos Henrique

Prof. Carlos Henrique

Banca: CESPE
Órgão: ABIN
Prova: Oficial Técnico de Inteligência - Área 7
Julgue o item que se segue, relativo a análise multivariada.
Se X e Y forem variáveis independentes e tiverem distribuição
normal com médias μ
x
e μ
y
, respectivamente, e variâncias σ
2
x
e σ
2
y

, respectivamente, então a soma X + Y terá média μ
x
+ μ
y
e
variância σ
2
x
+ σ
2
y
.

Prof. Carlos Henrique

Prof. Carlos Henrique

José da Silva, um diligente servidor público, realizou uma
pesquisa entre a relação do número de faltas ao serviço (x) e o
número de jogos do Flamengo em um campeonato qualquer (y).
José da Silva descobriu que o coeficiente de correlação linear de
Pearson das duas variáveis é 0,8, enquanto que os desvios padrões
das variáveis x e y são, respectivamente, 4 e 5.

Julgue o item seguinte

O desvio padrão da diferença entre as variáveis x e y é 3

Prof. Carlos Henrique
Correlação Linear

Prof. Carlos Henrique
Correlação Linear

Prof. Carlos Henrique
Correlação Linear

Prof. Carlos Henrique
Correlação Linear

Prof. Carlos Henrique
Covariância

Covariância é a média do produtos dos desvios em relação à
média aritmética

Ou

Covariância é a média dos produtos menos o produto das
médias.

Prof. Carlos Henrique

Prof. Carlos Henrique

Prof. Carlos Henrique

Prof. Carlos Henrique
Coeficiente de Correlação Linear de
Pearson

Prof. Carlos Henrique
COEFICIENTE DE CORRELAÇÃO
LINEAR DE PEARSON

Prof. Carlos Henrique
Coeficiente de Correlação Linear de
Pearson

Prof. Carlos Henrique
Coeficiente de Determinação

Prof. Carlos Henrique
Intervalo do coeficiente de Correlação
Linear de Pearson e do coeficiente de
determinação

Prof. Carlos Henrique
Correlação Linear

Prof. Carlos Henrique
Correlação Linear

Prof. Carlos Henrique
Correlação Linear

Prof. Carlos Henrique
Correlação Linear

Prof. Carlos Henrique
Correlação Linear

Prof. Carlos Henrique
Correlação Linear

Prof. Carlos Henrique
Correlação Linear
Sejam X e Y duas variáveis aleatórias e
Julgue os itens seguintes

Var(X) = E(X
2
) + [E(X)]
2


E(XY) = Cov(X,Y) + E(X) · E(Y)

E(2X + 3) = 2E(X)

Se Cov(X,Y) = 0 então X e Y são independentes.

Prof. Carlos Henrique
Correlação Linear

E(X + Y) = E(X) + E(Y) somente no caso de X e Y serem
independentes.

E(2X + 5) = 4E(X)

Var(X + 10) = Var(X) + 10

Cov(X,Y) = Var(X) · Var(Y)

E(3X + 2Y) = 9E(X) + 4E(Y)

Prof. Carlos Henrique
Correlação Linear

Prof. Carlos Henrique
Propriedades da Covariância

Prof. Carlos Henrique
Propriedades da Covariância

Prof. Carlos Henrique
Propriedades do Coeficiente da
Correlação Linear

Prof. Carlos Henrique

Prof. Carlos Henrique

Prof. Carlos Henrique

Prof. Carlos Henrique
Correlação Linear

Prof. Carlos Henrique
Correlação Linear

Prof. Carlos Henrique
Correlação Linear
Duas variáveis aleatórias x (número de casas) e y (quantidade de
carros) têm coeficiente de correlação linear igual a 0,8. Se w e z
são tais que w = 2x – 3 e z = 4 + 2y, calcule o coeficiente de
correlação entre w e z.

Prof. Carlos Henrique

Prof. Carlos Henrique
VARIÂNCIA DA SOMA OU DA
DIFERENÇA DE DUAS VARIÁVEIS

Prof. Carlos Henrique

Prof. Carlos Henrique

Prof. Carlos Henrique

Julgue o item que se segue, relativo a análise multivariada.

Se X e Y forem variáveis independentes e tiverem distribuição
normal com médias μ
x
e μ
y
, respectivamente, e variâncias σ
2
x
e σ
2
y

, respectivamente, então a soma X + Y terá média μ
x
+ μ
y
e
variância σ
2
x
+ σ
2
y
.

Prof. Carlos Henrique

Prof. Carlos Henrique

José da Silva, um diligente servidor público, realizou uma
pesquisa entre a relação do número de faltas ao serviço (x) e o
número de jogos do Flamengo em um campeonato qualquer (y).
José da Silva descobriu que o coeficiente de correlação linear de
Pearson das duas variáveis é 0,8, enquanto que os desvios padrões
das variáveis x e y são, respectivamente, 4 e 5.

Julgue o item seguinte

O desvio padrão da diferença entre as variáveis x e y é 3

Prof. Carlos Henrique
Correlação Linear

Prof. Carlos Henrique
Correlação Linear

Prof. Carlos Henrique
Correlação Linear

Prof. Carlos Henrique
Correlação Linear

ANÁLISE DE VARIÂNCIA DA REGRESSÃO
Prof. Carlos
Henrique

Prof. Carlos Henrique
Análise de Variância da Regressão
A estratégia que adotamos para verificar se compensa ou não
utilizar um modelo de regressão linear, &#3627408460;?????? = &#3627409148; + &#3627409149;&#3627408459;?????? + ????????????, é
observar a redução no resíduo (desvio) quando comparado com
um modelo aproximadamente uniforme &#3627408460;?????? = ?????? + ????????????.

Se a redução é muito pequena, significa dizer que os dois modelos
são praticamente equivalentes. Isso ocorre quando a inclinação &#3627409149;
for zero ou um valor muito pequeno, não compensando usar um
modelo mais complexo.

Prof. Carlos Henrique
Análise de Variância da Regressão
Assim, estamos interessados em testar a hipótese:

Prof. Carlos Henrique
Análise de Variância da Regressão
Se a hipótese nula é aceita, concluímos que não existe relação
linear significativa entre as variáveis &#3627408459; e &#3627408460;.

Prof. Carlos Henrique
Análise de Variância da Regressão
O resultado da análise de variância da regressão é uma tabela
que resume várias medidas usadas no teste de hipóteses
anterior. Para montar a tabela de análise de variância
(ANOVA), precisamos conhecer: os graus de liberdade, as
somas dos quadrados e os quadrados médios do modelo, dos
resíduos (erros ou desvios) e total.

Prof. Carlos Henrique
GRAUS DE LIBERDADE

Prof. Carlos Henrique
GRAUS DE LIBERDADE
O número total de graus de liberdade de uma amostra de
tamanho &#3627408475; é:

??????&#3627408447;
??????&#3627408476;??????????????????
= &#3627408475; − 1

Prof. Carlos Henrique
GRAUS DE LIBERDADE

Como vimos anteriormente, a equação de regressão possui apenas
dois parâmetros (&#3627409148; &#3627408466; &#3627409149;). Portanto, o número de graus de liberdade
do modelo é:

??????&#3627408447;
&#3627408448;&#3627408476;&#3627408465;&#3627408466;??????&#3627408476;
= 2 − 1 = 1

Prof. Carlos Henrique
GRAUS DE LIBERDADE
Agora, temos que descobrir o número de graus de liberdade dos
resíduos. Para isso, utilizamos a seguinte relação:

??????&#3627408447;
??????&#3627408476;??????????????????
= ??????&#3627408447;
&#3627408448;&#3627408476;&#3627408465;&#3627408466;??????&#3627408476;
+ GL
RESÍDUOS



Daí, concluímos que:

&#3627408475; − 1 = 1 + ??????&#3627408447;
??????&#3627408466;&#3627408480;í&#3627408465;&#3627408482;??????&#3627408480;


??????&#3627408447;
??????&#3627408466;&#3627408480;í&#3627408465;&#3627408482;??????&#3627408480;
= &#3627408475; − 2

Prof. Carlos Henrique
GRAUS DE LIBERDADE

Prof. Carlos Henrique
SOMA DOS QUADRADOS

Prof. Carlos Henrique
SOMA DOS QUADRADOS TOTAIS

Prof. Carlos Henrique
SOMA DOS QUADRADOS DO
MODELO DE REGRESSÃO

Prof. Carlos Henrique
Análise de Variância da Regressão

Prof. Carlos Henrique
SOMA DOS QUADRADOS DOS
RESÍDUOS

Prof. Carlos Henrique
Análise de Variância da Regressão

Prof. Carlos Henrique
Análise de Variância da Regressão

Prof. Carlos Henrique
COEFICIENTE DE DETERMINAÇÃO

Prof. Carlos Henrique
COEFICIENTE DE CORRELAÇÃO AJUSTADO

Prof. Carlos Henrique
QUADRADOS MÉDIOS

Prof. Carlos Henrique
QUADRADO MÉDIO DO MODELO

Prof. Carlos Henrique
QUADRADO MÉDIO DOS RESÍDUOS

Prof. Carlos Henrique
QUADRADO MÉDIO TOTAL

Prof. Carlos Henrique
ESTATÍSTICA F (RAZÃO F)
Para testar ??????
0
: &#3627409149; = 0 contra ??????
1
: &#3627409149; ≠ 0, usamos a seguinte
estatística teste, denominada de estatística ?????? (ou razão F):

Prof. Carlos Henrique
Análise de Variância da Regressão
Dessa forma, para avaliar o teste de hipóteses, basta
compararmos o valor da estatística teste com o valor
crítico tabelado:
• Se ??????

> ??????&#3627408464;&#3627408479;í&#3627408481;??????&#3627408464;??????, podemos rejeitar a hipótese nula;
• Se ??????

< ??????&#3627408464;&#3627408479;í&#3627408481;??????&#3627408464;??????, não podemos rejeitar a hipótese nula.

Prof. Carlos Henrique
TABELA ANOVA

Prof. Carlos Henrique
Análise de Variância da Regressão

Prof. Carlos Henrique
Análise de Variância da Regressão
(CESPE 2018/EBSERH) Determinado estudo considerou um modelo
de regressão linear simples na forma
&#3627408538;?????? = ??????
&#3627409358;
+ ??????
&#3627409359;
&#3627408537;
??????
+ ??????
??????
, em que &#3627408538;?????? representa o número de leitos por
habitante existente no município ??????; &#3627408537;??????
representa um indicador de qualidade de vida referente a esse
mesmo município ??????, para ?????? = &#3627409359;, ⋯ , ??????. A
componente ???????????? representa um erro aleatório com média &#3627409358; e
variância ??????
&#3627409360;
. A tabela a seguir mostra a tabela
ANOVA resultante do ajuste desse modelo pelo método dos
mínimos quadrados ordinários.

Prof. Carlos Henrique
Análise de Variância da Regressão

Prof. Carlos Henrique
Análise de Variância da Regressão
A partir das informações e da tabela apresentadas, julgue os itens subsequentes.

O referido estudo contemplou um conjunto de dados obtidos de
&#3627408475; = 11 municípios.

A correlação linear entre o número de leitos hospitalares por
habitante (y) e o indicador de qualidade de vida (x) foi igual a
0,9.

Prof. Carlos Henrique
Análise de Variância da Regressão
A razão F da tabela ANOVA refere-se ao teste de significância
estatística do intercepto &#3627409149;
0
, em que se testa a hipótese nula
??????
0
: &#3627409149;
0
= 0 contra a hipótese alternativa ??????
??????
: &#3627409149;
0
≠ 0.

O desvio padrão amostral do número de leitos por habitante
foi superior a 10 leitos por habitante.

Prof. Carlos Henrique
Análise de Variância da Regressão
A estimativa de ??????
2
foi igual a 10.

O ??????
2
ajustado foi inferior a 0,9.

Prof. Carlos Henrique
Análise de Variância da Regressão

Prof. Carlos Henrique
Análise de Variância da Regressão
(AGENTE PF – 2018) Um pesquisador estudou a relação entre a
taxa de criminalidade (Y) e a taxa de desocupação da população
economicamente ativa (X) em determinada região do país.
Esse pesquisador aplicou um modelo de regressão linear simples
na forma Y = bX + a + ε, em que b representa o coeficiente
angular, a é o intercepto do modelo e ε denota o erro aleatório
com média zero e variância σ
2
. A tabela a seguir representa a
análise de variância (ANOVA) proporcionada por esse modelo.

Prof. Carlos Henrique
Análise de Variância da Regressão

Prof. Carlos Henrique
Análise de Variância da Regressão
A respeito dessa situação hipotética, julgue os próximos itens,
sabendo que b > 0 e que o desvio padrão amostral da variável X é
igual a 2.

A correlação linear de Pearson entre a variável resposta Y e a
variável regressora X e igual a 0,75.

A estimativa da variância σ
2
é superior a 0,5.

A estimativa do coeficiente angular b, pelo método de mínimos
quadrados ordinários, é igual a 0,25.

Prof. Carlos Henrique
Análise de Variância da Regressão
Tags