ANÁLISE DE
VARIÂNCIA
Prof.: Laís Rodrigues da Costa Chaves
Contato: [email protected]
1
ANOVA 1 FATOR
ANOVA DE 1 FATOR
3
•Investiga o efeito e 1 fator controlável (X) alterado a vários
níveis ou grupos k.
•Seu objetivo é identificar se a média dos valores da variável
resposta (Y) diferem significativamente nos diferentes níveis ou
grupos dos fatores controláveis.
ANOVA DE 1 FATOR
4
•Modelo estatístico:
Onde: =média geral;
??????
�= efeito do grupo j;
??????
��= erro aleatório.
??????
��=??????+??????
�+??????
��
Um estudante deseja verificar se a temperatura ambiente (X) influencia na umidade
relativa do ar (Y), para isso realizou 3 leituras (n), com um mesmo medidor, em um
ponto do laboratório. Depois, alterando a temperatura, realizou as demais leituras.
5
ANOVA DE 1 FATOR - EXEMPLO
Fator controlável
Níveis do fator controlável (K)
Repetições (n)
Medição da variável resposta
6
SOMA DOS QUADRADOS TOTAL
��� = Variabilidade residual dentro do
grupo provocada pelos fatores de ruído
��� = Variação entre as médias dos
grupos provocada pelo fator controlável
���=���+���
7
SOMA DOS QUADRADOS TOTAL
��� = Variabilidade residual dentro do
grupo provocada pelos fatores de ruído
��� = Variação entre as médias dos
grupos provocada pelo fator controlável
���=���+���
8
SOMA DOS QUADRADOS TOTAL
��� = Variabilidade residual dentro do
grupo provocada pelos fatores de ruído
��� = Variação entre as médias dos
grupos provocada pelo fator controlável
��� = ��� + ���
S=
σ�
�−ҧ�
2
�−1
??????
��−ധ??????=ഥ??????
�−ധ??????+??????
��−ഥ??????
�
�=1
??????
�=1
�
??????
��−ധ??????
2
=�
�=1
�
ഥ??????
�−ധ??????
2
+
�=1
??????
�=1
�
??????
��−ഥ??????
�
2
(�−1) = (�−1) + (�−�)
�−� = todas as observações em
relação à média de cada grupo
�−1 = média do número de níveis em
relação à média geral
K= número de níveis
N = total de observações
9
HIPÓTESES
•H
0: as médias das variável
resposta não diferem
significativamente.
�
1 �
2 �
3
•H
1: as médias das variáveis resposta
diferem significativamente
�
1 �
2 �
3
Efeito do grupo → ??????
�= 0 Efeito do grupo → ??????
� 0
TESTE F
10
•Se não há diferenças significativas entre os grupos
•O teste F compara duas variâncias:
•Se o teste F
cal=1 conclui-se que não existem evidências
suficientes para rejeitar H
0
����??????���=�������
�
����=
????????????�??????�???????????? ����� ??????�����
????????????�??????�???????????? ������ �� ??????����
=
����??????���
�������
=1
TESTE F
11
•Se há diferenças significativas entre os grupos
•Logo:
•Se o teste F
calc ≫ 1: Fcal Ftab ou Valor-p = 0,05
•Conclui-se que existem evidências suficientes para rejeitar H
0
�
����=
????????????�??????�???????????? ����� ??????�����
????????????�??????�???????????? ������ �� ??????����
=
����??????���
�������
≫1
����??????���>�������
•O valor de Ftab é estabelecido usando os valores da distribuição
F de Fischer-Snedecor:
=nível de significância (usualmente 0,05)
K-1=graus de liberdade do numerador(MQG)
N-K=graus de liberdade do denominador (MQR)
•No excel:
VALOR DO F TAB
12
�
??????��=�
??????,??????−1,??????−�
�
??????��=??????�??????.�.��0,05;�−1;�−�
Valor-p=�??????��.�.���
����;�−1;�−�
13
TESTE F
Área de rejeição
(H
0)
F
tabF
cal
= 0,05
Valor-p
Área de aceitação
(H
0)
Área de rejeição
(H
0)
F
tabF
cal
= 0,05
Valor-p
Área de aceitação
(H
0)
Fcal Ftab ou Valor-p = 0,05 Fcal Ftab ou Valor-p = 0,05
14
TESTE F
TABELA ANOVA
15
•Investiga o efeito e 1 fator controlável (X) alterado a vários
níveis ou grupos k.
•Seu objetivo é identificar se a média dos valores da variável
resposta (Y) diferem significativamente nos diferentes níveis ou
grupos dos fatores controláveis.
Fonte SQ GDL MQ Teste F FtabValor-p
Entre GruposSQG K-1MQGF=MQG/MQR
Dentro GruposSQR N-KMQR
Total SQT N-1
16
FÓRMULAS SIMPLIFICADAS
TC = Termo de correção
Y
ij = valor de cada observação
T
j = soma de observações em um nível
T = soma total das obsevações
N = número total de observação
n
j = número de observações em um nível
��=
�
2
�
���=??????
��
2
−��
���= ൘
�
�
2
�
�
−��
���=���−���
1..
2..
3..
4..
5..
6..
���=
���
�−1
���=
���
�−�
COMPARAÇÃO
MÚLTIPLA DE
MÉDIAS
OTIMIZAÇÃO
18
•Se a hipótese nula for rejeitada, conclui-se que o efeito do fator
é significativo sobre a variável de resposta.
•Para se otimizar um processo, é necessário identificar o nível do
fator controlável que otimiza a variável de resposta.
•Quando o fator possui mais de dois níveis, se utiliza uma
Comparação Múltipla de Médias (CMM) para identificar quais
deles diferem entre si.
TEOREMA DO LIMITE CENTRAL
19
•Os indicadores de desempenho seguem deferentes tipos de
distribuição, mas as médias seguem sempre a distribuição
normal.
•A média das médias amostrais é sempre igual à média dos
valores individuais: ധ�=??????
•O desvio-padrão das médias é menor do que o desvio-padrão dos
valores individuais na razão de Τ1�, logo ො??????
ത�=
??????
??????
20
COMPARAÇÃO MÚLTIPLA DE MÉDIAS ( CMM)
-3 -2 -1 0 +1 +2 +3
??????
ത�
??????
•Método de Duncan:
1.Calcular o desvio padrão pelo Teorema do Limite Central:
ҧ�
�=
�
�
=
���
�
2.Calcular o limite de decisão, considerando o tamanho da curva
normal de distribuição das médias (3):
��=3�
ത�
3.Escrever as médias em ordem crescente (ou decrescente) e
compará-las duas a duas. A diferença será significativa se for
maior que Ld.
4.Usar barras contínuas sobre as médias que não se diferem.
21
COMPARAÇÃO MÚLTIPLA DE MÉDIAS ( CMM)
•ANOVA DE 1 fator – Exemplo:
1.Desvio padrão:
ҧ�
�=
�
�
=
���
�
=
6
9
=0,816
2.Limite de decisão:
��=3�
ത�=3×0,816=2,45
3.Comparação das médias:
49,33-41,67=7,66Ld=2,45 SIGNIFICATIVO
41,67-36,33=5,34Ld=2,45 SIGNIFICATIVO
4.Usar barras contínuas:
y
3=36,33 y
2=41,67 y
1=49,33
22
COMPARAÇÃO MÚLTIPLA DE MÉDIAS ( CMM)
•ANOVA DE 1 fator – Exemplo:
1.Gráfico de barras
y
3=36,33 y
2=41,67 y
1=49,33
36,333
41,667
49,333
0,00
10,00
20,00
30,00
40,00
50,00
60,00