HelcioSuguiyama2
131 views
156 slides
Nov 01, 2022
Slide 1 of 156
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
About This Presentation
correlação linear estatística
Size: 2.64 MB
Language: pt
Added: Nov 01, 2022
Slides: 156 pages
Slide Content
CORRELAÇÃO LINEAR
Prof. Carlos
Henrique
Prof. Carlos Henrique
As correlações podem ser:
a) direta – ocorre com dois experimentos que variam no
mesmo sentido. Se aumentarmos
ou diminuirmos um deles, o outro também aumentará ou
diminuirá;
b) inversa – ocorre com dois fenômenos que variam em
sentido contrário. Se
aumentarmos ou diminuirmos um deles, acontecerá o
inverso com o outro, ou seja, diminuirá ou
aumentará;
Prof. Carlos Henrique
c) Correlação nula – quando não existe correlação, ou
seja, as variáveis são independentes
e) Correlação não linear – há uma correlação, porém ela
não ela não é linear
Prof. Carlos Henrique
Correlação DIRETA
Prof. Carlos Henrique
Correlação Inversa
Prof. Carlos Henrique
Correlação Nula
Prof. Carlos Henrique
Correlação Não-Linear
REGRESSÃO LINEAR SIMPLES
Prof. Carlos
Henrique
Prof. Carlos Henrique
FUNÇÃO DO PRIMEIRO GRAU
Prof. Carlos Henrique
FUNÇÃO DO PRIMEIRO GRAU
Prof. Carlos Henrique
FUNÇÃO DO PRIMEIRO GRAU
Prof. Carlos Henrique
FUNÇÃO DO PRIMEIRO GRAU
Prof. Carlos Henrique
Regressão Linear Simples
Prof. Carlos Henrique
O termo � + ��?????? é o componente de �?????? que varia
linearmente, de acordo com �?????? . Por sua vez, ???????????? é o
componente aleatório de �?????? que descreve os erros (ou
desvios) cometidos quando tentamos aproximar uma
série de observações �?????? por meio de uma reta �??????.
Nesse modelo, �?????? é a variável cujo comportamento
desejamos prever ou explicar, sendo chamada de variável
dependente ou resposta. Por outro lado, a variável �?????? é
utilizada para explicar o comportamento de �?????? , sendo
conhecida como independente, regressora, explanatória
ou explicativa.
Prof. Carlos Henrique
Regressão Linear Simples
O modelo de regressão linear requer que sejam atendidos
alguns pressupostos básicos quanto à variável aleatória ???????????? (erro
ou desvio):
i) ??????(????????????) = ??????. A média dos erros é igual a zero. Ou seja, os desvios
"para cima da reta" igualam o valor dos desvios "para baixo
da reta" na média.
Prof. Carlos Henrique
MÉTODO DOS MÍNIMOS
QUADRADOS
Prof. Carlos Henrique
Covariância
Covariância é a média do produtos dos desvios em relação à
média aritmética
Ou
Covariância é a média dos produtos menos o produto das
médias.
Prof. Carlos Henrique
COEFICIENTE ANGULAR
Prof. Carlos Henrique
COEFICIENTE LINEAR
Prof. Carlos Henrique
COEFICIENTE ANGULAR
Prof. Carlos Henrique
Regressão Linear Simples
Prof. Carlos Henrique
Regressão Linear Simples
Se a estimativa do coeficiente angular da reta obtida por meio
do método dos mínimos quadrados foi de 1,8, calcule a
previsão do faturamento em um determinado ano, uma vez
que a empresa gastou com propaganda neste ano 2 milhões de
reais
Prof. Carlos Henrique
Regressão Linear Simples
Prof. Carlos Henrique
Regressão Linear Simples
Prof. Carlos Henrique
Regressão Linear Simples
Prof. Carlos Henrique
Regressão Linear Simples
Prof. Carlos Henrique
Prof. Carlos Henrique
Regressão Linear Simples
Prof. Carlos Henrique
Regressão Linear Simples
Prof. Carlos Henrique
Regressão Linear Simples
Prof. Carlos Henrique
Atenção: Para responder à questão considere um estudo
com o objetivo de obter a relação entre duas variáveis X e Y
por meio do modelo Yi = α + βXi + ∈i, em que i corresponde
à i-ésima observação de X e Y. Os parâmetros α e β são
desconhecidos e ∈i é o erro aleatório com as respectivas
hipóteses consideradas para a regressão linear simples. Com
base em 20 pares de observações (Xi , Yi), i = 1, 2, ..., 20 e
utilizando o método dos mínimos quadrados foram obtidas
as estimativas para α e β.
Prof. Carlos Henrique
Regressão Linear Simples
Prof. Carlos Henrique
Considerando a equação da reta obtida pelo método
dos mínimos quadrados, tem-se que o valor para X
tal que Y = 15 é
(A) 6,0.
(B) 10,5.
(C) 9,0.
(D) 7,5.
(E) 12,0.
Prof. Carlos Henrique
Regressão Linear Simples
Prof. Carlos Henrique
Regressão Linear Simples
Uma empresa fabricante de produtos farmacêuticos, empregando alta tecnologia,
realizou um levantamento do custo total de um de seus produtos (Y), expresso em mil
reais, em função do número total de comprimidos produzidos (X), expresso em
unidades, durante 25 meses, com o objetivo de montar uma regressão linear simples
entre essas variáveis. Observe os seguintes resultados:
Prof. Carlos Henrique
Regressão Linear Simples
Calcule a reta que melhor se ajusta a esses dados no sentido de minimizar o
quadrado da diferença entre os valores observados e os estimados.
Prof. Carlos Henrique
Coeficiente de Correlação Linear de
Pearson
Prof. Carlos Henrique
COEFICIENTE DE CORRELAÇÃO
LINEAR DE PEARSON
Prof. Carlos Henrique
Coeficiente de Correlação Linear de
Pearson
Prof. Carlos Henrique
Coeficiente de Determinação
Prof. Carlos Henrique
Intervalo do coeficiente de Correlação
Linear de Pearson e do coeficiente de
determinação
Prof. Carlos Henrique
Correlação Linear
Prof. Carlos Henrique
Correlação Linear
Prof. Carlos Henrique
Correlação Linear
Prof. Carlos Henrique
Correlação Linear
Prof. Carlos Henrique
Correlação Linear
Prof. Carlos Henrique
Correlação Linear
Prof. Carlos Henrique
Correlação Linear
Sejam X e Y duas variáveis aleatórias e
Julgue os itens seguintes
Var(X) = E(X
2
) + [E(X)]
2
E(XY) = Cov(X,Y) + E(X) · E(Y)
E(2X + 3) = 2E(X)
Se Cov(X,Y) = 0 então X e Y são independentes.
Prof. Carlos Henrique
Correlação Linear
E(X + Y) = E(X) + E(Y) somente no caso de X e Y serem
independentes.
E(2X + 5) = 4E(X)
Var(X + 10) = Var(X) + 10
Cov(X,Y) = Var(X) · Var(Y)
E(3X + 2Y) = 9E(X) + 4E(Y)
Prof. Carlos Henrique
Correlação Linear
Prof. Carlos Henrique
Propriedades da Covariância
Prof. Carlos Henrique
Propriedades da Covariância
Prof. Carlos Henrique
Propriedades do Coeficiente da
Correlação Linear
Prof. Carlos Henrique
Prof. Carlos Henrique
Prof. Carlos Henrique
Prof. Carlos Henrique
Sejam X, Y e Z três variáveis com correlações de Pearson
expressas pela matriz abaixo:
Prof. Carlos Henrique
Correlação Linear
Julgue os itens seguintes:
X e Z são independentes.
a correlação entre X e Y é negativa.
a correlação entre V = a + bX e W = c + dZ, com
a ≠ 0, c ≠ 0, b > 0 e d < 0 é negativa.
a covariância entre X e Y é igual a 0,64.
Prof. Carlos Henrique
Correlação Linear
Prof. Carlos Henrique
Correlação Linear
Prof. Carlos Henrique
Correlação Linear
Duas variáveis aleatórias x e y têm coeficiente de correlação linear
igual a 0,8. Se w e z são tais que w = 2x – 3 e z = 4 – 2y então o
coeficiente de correlação entre w e z será igual a:
(A) –0,8.
(C) 0,36.
(B) –0,64.
(D) 0,64.
(E) 0,8.
Prof. Carlos Henrique
Prof. Carlos Henrique
VARIÂNCIA DA SOMA OU DA
DIFERENÇA DE DUAS VARIÁVEIS
Prof. Carlos Henrique
Prof. Carlos Henrique
Prof. Carlos Henrique
Banca: CESPE
Órgão: ABIN
Prova: Oficial Técnico de Inteligência - Área 7
Julgue o item que se segue, relativo a análise multivariada.
Se X e Y forem variáveis independentes e tiverem distribuição
normal com médias μ
x
e μ
y
, respectivamente, e variâncias σ
2
x
e σ
2
y
, respectivamente, então a soma X + Y terá média μ
x
+ μ
y
e
variância σ
2
x
+ σ
2
y
.
Prof. Carlos Henrique
Prof. Carlos Henrique
José da Silva, um diligente servidor público, realizou uma
pesquisa entre a relação do número de faltas ao serviço (x) e o
número de jogos do Flamengo em um campeonato qualquer (y).
José da Silva descobriu que o coeficiente de correlação linear de
Pearson das duas variáveis é 0,8, enquanto que os desvios padrões
das variáveis x e y são, respectivamente, 4 e 5.
Julgue o item seguinte
O desvio padrão da diferença entre as variáveis x e y é 3
Prof. Carlos Henrique
Correlação Linear
Prof. Carlos Henrique
Correlação Linear
Prof. Carlos Henrique
Correlação Linear
Prof. Carlos Henrique
Correlação Linear
Prof. Carlos Henrique
Covariância
Covariância é a média do produtos dos desvios em relação à
média aritmética
Ou
Covariância é a média dos produtos menos o produto das
médias.
Prof. Carlos Henrique
Prof. Carlos Henrique
Prof. Carlos Henrique
Prof. Carlos Henrique
Coeficiente de Correlação Linear de
Pearson
Prof. Carlos Henrique
COEFICIENTE DE CORRELAÇÃO
LINEAR DE PEARSON
Prof. Carlos Henrique
Coeficiente de Correlação Linear de
Pearson
Prof. Carlos Henrique
Coeficiente de Determinação
Prof. Carlos Henrique
Intervalo do coeficiente de Correlação
Linear de Pearson e do coeficiente de
determinação
Prof. Carlos Henrique
Correlação Linear
Prof. Carlos Henrique
Correlação Linear
Prof. Carlos Henrique
Correlação Linear
Prof. Carlos Henrique
Correlação Linear
Prof. Carlos Henrique
Correlação Linear
Prof. Carlos Henrique
Correlação Linear
Prof. Carlos Henrique
Correlação Linear
Sejam X e Y duas variáveis aleatórias e
Julgue os itens seguintes
Var(X) = E(X
2
) + [E(X)]
2
E(XY) = Cov(X,Y) + E(X) · E(Y)
E(2X + 3) = 2E(X)
Se Cov(X,Y) = 0 então X e Y são independentes.
Prof. Carlos Henrique
Correlação Linear
E(X + Y) = E(X) + E(Y) somente no caso de X e Y serem
independentes.
E(2X + 5) = 4E(X)
Var(X + 10) = Var(X) + 10
Cov(X,Y) = Var(X) · Var(Y)
E(3X + 2Y) = 9E(X) + 4E(Y)
Prof. Carlos Henrique
Correlação Linear
Prof. Carlos Henrique
Propriedades da Covariância
Prof. Carlos Henrique
Propriedades da Covariância
Prof. Carlos Henrique
Propriedades do Coeficiente da
Correlação Linear
Prof. Carlos Henrique
Prof. Carlos Henrique
Prof. Carlos Henrique
Prof. Carlos Henrique
Correlação Linear
Prof. Carlos Henrique
Correlação Linear
Prof. Carlos Henrique
Correlação Linear
Duas variáveis aleatórias x (número de casas) e y (quantidade de
carros) têm coeficiente de correlação linear igual a 0,8. Se w e z
são tais que w = 2x – 3 e z = 4 + 2y, calcule o coeficiente de
correlação entre w e z.
Prof. Carlos Henrique
Prof. Carlos Henrique
VARIÂNCIA DA SOMA OU DA
DIFERENÇA DE DUAS VARIÁVEIS
Prof. Carlos Henrique
Prof. Carlos Henrique
Prof. Carlos Henrique
Julgue o item que se segue, relativo a análise multivariada.
Se X e Y forem variáveis independentes e tiverem distribuição
normal com médias μ
x
e μ
y
, respectivamente, e variâncias σ
2
x
e σ
2
y
, respectivamente, então a soma X + Y terá média μ
x
+ μ
y
e
variância σ
2
x
+ σ
2
y
.
Prof. Carlos Henrique
Prof. Carlos Henrique
José da Silva, um diligente servidor público, realizou uma
pesquisa entre a relação do número de faltas ao serviço (x) e o
número de jogos do Flamengo em um campeonato qualquer (y).
José da Silva descobriu que o coeficiente de correlação linear de
Pearson das duas variáveis é 0,8, enquanto que os desvios padrões
das variáveis x e y são, respectivamente, 4 e 5.
Julgue o item seguinte
O desvio padrão da diferença entre as variáveis x e y é 3
Prof. Carlos Henrique
Correlação Linear
Prof. Carlos Henrique
Correlação Linear
Prof. Carlos Henrique
Correlação Linear
Prof. Carlos Henrique
Correlação Linear
ANÁLISE DE VARIÂNCIA DA REGRESSÃO
Prof. Carlos
Henrique
Prof. Carlos Henrique
Análise de Variância da Regressão
A estratégia que adotamos para verificar se compensa ou não
utilizar um modelo de regressão linear, �?????? = � + ��?????? + ????????????, é
observar a redução no resíduo (desvio) quando comparado com
um modelo aproximadamente uniforme �?????? = ?????? + ????????????.
Se a redução é muito pequena, significa dizer que os dois modelos
são praticamente equivalentes. Isso ocorre quando a inclinação �
for zero ou um valor muito pequeno, não compensando usar um
modelo mais complexo.
Prof. Carlos Henrique
Análise de Variância da Regressão
Assim, estamos interessados em testar a hipótese:
Prof. Carlos Henrique
Análise de Variância da Regressão
Se a hipótese nula é aceita, concluímos que não existe relação
linear significativa entre as variáveis � e �.
Prof. Carlos Henrique
Análise de Variância da Regressão
O resultado da análise de variância da regressão é uma tabela
que resume várias medidas usadas no teste de hipóteses
anterior. Para montar a tabela de análise de variância
(ANOVA), precisamos conhecer: os graus de liberdade, as
somas dos quadrados e os quadrados médios do modelo, dos
resíduos (erros ou desvios) e total.
Prof. Carlos Henrique
GRAUS DE LIBERDADE
Prof. Carlos Henrique
GRAUS DE LIBERDADE
O número total de graus de liberdade de uma amostra de
tamanho � é:
Como vimos anteriormente, a equação de regressão possui apenas
dois parâmetros (� � �). Portanto, o número de graus de liberdade
do modelo é:
Prof. Carlos Henrique
GRAUS DE LIBERDADE
Agora, temos que descobrir o número de graus de liberdade dos
resíduos. Para isso, utilizamos a seguinte relação:
Prof. Carlos Henrique
SOMA DOS QUADRADOS DO
MODELO DE REGRESSÃO
Prof. Carlos Henrique
Análise de Variância da Regressão
Prof. Carlos Henrique
SOMA DOS QUADRADOS DOS
RESÍDUOS
Prof. Carlos Henrique
Análise de Variância da Regressão
Prof. Carlos Henrique
Análise de Variância da Regressão
Prof. Carlos Henrique
COEFICIENTE DE DETERMINAÇÃO
Prof. Carlos Henrique
COEFICIENTE DE CORRELAÇÃO AJUSTADO
Prof. Carlos Henrique
QUADRADOS MÉDIOS
Prof. Carlos Henrique
QUADRADO MÉDIO DO MODELO
Prof. Carlos Henrique
QUADRADO MÉDIO DOS RESÍDUOS
Prof. Carlos Henrique
QUADRADO MÉDIO TOTAL
Prof. Carlos Henrique
ESTATÍSTICA F (RAZÃO F)
Para testar ??????
0
: � = 0 contra ??????
1
: � ≠ 0, usamos a seguinte
estatística teste, denominada de estatística ?????? (ou razão F):
Prof. Carlos Henrique
Análise de Variância da Regressão
Dessa forma, para avaliar o teste de hipóteses, basta
compararmos o valor da estatística teste com o valor
crítico tabelado:
• Se ??????
∗
> ??????��í�??????�??????, podemos rejeitar a hipótese nula;
• Se ??????
∗
< ??????��í�??????�??????, não podemos rejeitar a hipótese nula.
Prof. Carlos Henrique
TABELA ANOVA
Prof. Carlos Henrique
Análise de Variância da Regressão
Prof. Carlos Henrique
Análise de Variância da Regressão
(CESPE 2018/EBSERH) Determinado estudo considerou um modelo
de regressão linear simples na forma
�?????? = ??????
�
+ ??????
�
�
??????
+ ??????
??????
, em que �?????? representa o número de leitos por
habitante existente no município ??????; �??????
representa um indicador de qualidade de vida referente a esse
mesmo município ??????, para ?????? = �, ⋯ , ??????. A
componente ???????????? representa um erro aleatório com média � e
variância ??????
�
. A tabela a seguir mostra a tabela
ANOVA resultante do ajuste desse modelo pelo método dos
mínimos quadrados ordinários.
Prof. Carlos Henrique
Análise de Variância da Regressão
Prof. Carlos Henrique
Análise de Variância da Regressão
A partir das informações e da tabela apresentadas, julgue os itens subsequentes.
O referido estudo contemplou um conjunto de dados obtidos de
� = 11 municípios.
A correlação linear entre o número de leitos hospitalares por
habitante (y) e o indicador de qualidade de vida (x) foi igual a
0,9.
Prof. Carlos Henrique
Análise de Variância da Regressão
A razão F da tabela ANOVA refere-se ao teste de significância
estatística do intercepto �
0
, em que se testa a hipótese nula
??????
0
: �
0
= 0 contra a hipótese alternativa ??????
??????
: �
0
≠ 0.
O desvio padrão amostral do número de leitos por habitante
foi superior a 10 leitos por habitante.
Prof. Carlos Henrique
Análise de Variância da Regressão
A estimativa de ??????
2
foi igual a 10.
O ??????
2
ajustado foi inferior a 0,9.
Prof. Carlos Henrique
Análise de Variância da Regressão
Prof. Carlos Henrique
Análise de Variância da Regressão
(AGENTE PF – 2018) Um pesquisador estudou a relação entre a
taxa de criminalidade (Y) e a taxa de desocupação da população
economicamente ativa (X) em determinada região do país.
Esse pesquisador aplicou um modelo de regressão linear simples
na forma Y = bX + a + ε, em que b representa o coeficiente
angular, a é o intercepto do modelo e ε denota o erro aleatório
com média zero e variância σ
2
. A tabela a seguir representa a
análise de variância (ANOVA) proporcionada por esse modelo.
Prof. Carlos Henrique
Análise de Variância da Regressão
Prof. Carlos Henrique
Análise de Variância da Regressão
A respeito dessa situação hipotética, julgue os próximos itens,
sabendo que b > 0 e que o desvio padrão amostral da variável X é
igual a 2.
A correlação linear de Pearson entre a variável resposta Y e a
variável regressora X e igual a 0,75.
A estimativa da variância σ
2
é superior a 0,5.
A estimativa do coeficiente angular b, pelo método de mínimos
quadrados ordinários, é igual a 0,25.
Prof. Carlos Henrique
Análise de Variância da Regressão