Conceitos Básicos de Estatística II

vitor_vasconcelos 11,874 views 38 slides Aug 04, 2016
Slide 1
Slide 1 of 38
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10
Slide 11
11
Slide 12
12
Slide 13
13
Slide 14
14
Slide 15
15
Slide 16
16
Slide 17
17
Slide 18
18
Slide 19
19
Slide 20
20
Slide 21
21
Slide 22
22
Slide 23
23
Slide 24
24
Slide 25
25
Slide 26
26
Slide 27
27
Slide 28
28
Slide 29
29
Slide 30
30
Slide 31
31
Slide 32
32
Slide 33
33
Slide 34
34
Slide 35
35
Slide 36
36
Slide 37
37
Slide 38
38

About This Presentation

Aula de Métodos e Técnicas de Análise da Informação para Planejamento, junho de 2017, UFABC
Apresentação disponível em: https://youtu.be/XM7nBYcjC-k


Slide Content

InferênciaEstatística:
ConceitosBásicosII
DistribuiçãoAmostrale Teoremado LimiteCentral
AnáliseExploratóriade dados no SPSS
Vitor Vieira Vasconcelos
Fláviada Fonseca Feitosa
BH1350 –Métodose Técnicasde Análiseda Informaçãoparao Planejamento
Junhode 2017

O Que Revisamos Na Aula
Passada
Populaçõese Amostras
Medidasde TendênciaCentral: Média, Moda, Mediana
Medidasde Variabilidade: Variânciae DesvioPadrão
CurvaNormal
Distribuiçõesde Frequênciae Probabilidade
Escorespadrão(valorpadronizadoz)
Cálculoda probabilidadesob a curvanormal
AmbienteSPSS

Aula de Hoje
ConceitosBásicosde InferênciaEstatística
(Continuação)
DistribuiçãoAmostrale Teoremado LimiteCentral

Leitura de Referência
Capítulo1
Tudoo que vocêsemprequis
sabersobreestatística
(bem, quasetudo)
(parcialmente, p. 42 –47)

Minha Amostra é
Representativa da
População?
DISTRIBUIÇÃO
AMOSTRAL
Convenções:
μ = médiapopulação
X = médiaamostra
σ= DP população
s = DP amostra
Usamosamostrasparaestimaro
comportamento/característicasde uma
população. Porexemplo, usamosa
médiada amostra(X), paraestimara
médiada população(μ).
Se pegarmosmuitasamostrasde uma
mesmapopulação, cadaamostraterá
suaprópriamédiae emváriasdessas
amostrasas médiasserãodiferentes.

Minha Amostra é
Representativa da
População?
Podemosconstruirumadistribuiçãode
frequênciacom as médiasdestas
amostras!
DISTRIBUIÇÃO AMOSTRAL
Distribuiçãode frequênciasdas médias
de todasas amostrasde umamesma
população. Estácentradano mesmo
valorquea médiada população
DISTRIBUIÇÃO
AMOSTRAL
Convenções:
μ = médiapopulação
X = médiaamostra
σ= DP população
s = DP amostra

Características de uma
distribuição amostral
DISTRIBUIÇÃO
AMOSTRAL
1.Se aproximade umacurvanormal
(desdequeo tamanhoda amostraseja
razoavelmentegrande–N > 30)
2. A médiade umadistribuiçãoamostral
(a médiadas médias) éigualà
verdadeiramédiapopulacional(μ).
3. O desviopadrãode umadistribuição
amostral(σ
X) émenordo queo da
população(σ). A médiaamostralémais
estáveldo queosescoresquea compõe.

Erro Padrão da Média
DISTRIBUIÇÃO
AMOSTRAL
ERRO PADRÃO
Mede variabilidade
entre as médiasde
diferentesamostras.
Na verdade, deveriasero desviopadrãoda populaçãodividido
pelaraizquadradado tamanhoda amostra; no entanto, para
amostrasgrandes, essaaproximaçãoérazoável.
ERRO PADRÃODA MÉDIA (σ
X)
Desviopadrãodas médiasdas amostras.
Medidade quãorepresentativaa
amostrapoderáserda população
Na realidadenãopodemosselecionar
centenasde amostrasparaconstruir
umadistribuiçãoamostral.
Técnicaparaestimaro erropadrãoa
partirdo desviopadrãoda amostra(s):
Dividirs pelaraizquadradado tamanho
da amostra(N)

Erro Padrão da Média
RECAPITULANDO:
Normalmenteestamosinteressadosemutilizara médiada
amostracomoumaestimativado valorda médiada
população.
No entanto, amostrasdiferentesfornecerãovalores
diferentesda média.
O ErroPadrãopodeserusadoparase terumaideiada
diferençaentre a médiada amostrae a médiada população.
O Erropadrãopodeserestimadomaiorquandoo desvio
padrãoda populaçãoémaior(nafaltado desviopadrãoda
população, usamoso da amostra); menorquandoo número
da amostraémaior.

Erro Padrão da Média
Alémde nosfornecerumaideiada diferençaentre a médiada
amostra(X) e a médiada população(μ)…
Com ajudado ErroPadrãoda Médiapodemosestimara
probabilidadede nossamédiapopulacionalsituar-se
realmentedentrode um intervalode valoresmédios
Conceitode INTERVALO DE CONFIANÇA

Intervalos de Confiança
Uma abordagemparadeterminara precisãoda
médiada amostra:
Calcularoslimitesentre osquaisacreditamosqueo
valorda médiaverdadeiraestará
INTERVALO DE CONFIANÇA
Gama de valores(limites) entre osquaisachamosque
o valorda população(parâmetro) estará
(no caso, o valorda médiaverdadeira)

Intervalos de Confiança
Um intervalode confiança(IC) de 95%
Como interpreto???
Se selecionarmos100 amostras, calcularmosa
médiae, depoisde determinarmoso intervalode
confiançaparaaquelamédia, 95% dos intervalos
de confiançaconterãoo valorreal da médiada
população

OK! Agora
vamosvercomo
se calculao IC…
DISTRIBUIÇÃO
AMOSTRAL DE
MÉDIAS
A MÉDIA DA NOSSA AMOSTRA ESTÁ EM
ALGUM PONTO DA DISTRIBUIÇÃO

Intervalos de Confiança
Lembramporqueo valor1,96
éum valorde z importante???
Lembremtambémcomo
podemosconverter
escoresemescores-z:
escores-z
E 2,58?
E 3,29?
Porque95% dos escoresde z estão
entre -1,96 e 1,96!!!

1,96-1,96

Intervalos de Confiança
Se soubermosquenossoslimitesserão-1,96 e 1,96,
emescores-z, quaissãoosescorescorrespondentes
emvaloresdos nossosdados?
[Éo inversodo quefizemosnaúltimaaula]
Para encontrarisso, vamosrecolocarz naequação
escores-z

escores-z
-
-

escores-z
Usamoso ErroPadrãoe nãoo Desvio
Padrãoporqueestamosinteressados
navariabilidadedas médiasdas
amostrase nãonavariabilidadedas
observaçõesdentroda amostra

Intervalos de Confiança

Exemplo –IC 95%
Digamosquetenhamoscoletadosdados sobreo preçodo m
2
dos
imóveisemum determinadobairro. Temosumaamostrade 100
imóveis(N=100), com média= 3800 e desviopadrão(s) =1500.
Cálculodo ErroPadrão(EP):

Exemplo –IC 95%
Digamosquetenhamoscoletadosdados sobreo preçodo m
2
dos
imóveisemum determinadobairro. Temosumaamostrade 100
imóveis(N=100), com média= 3800 e desviopadrão(s) = 1500.
Limiteinferior do intervalode confiança= 3800 –(1,96*150) = 3506
Limitesuperior do intervalode confiança= 3800 + (1,96*150) = 4094

Exemplo –IC 95%
Digamosquetenhamoscoletadosdados sobreo preçodo m
2
dos
imóveisno BairroW. Temosumaamostrade 100 imóveis(N=100),
com média= 3800 e desviopadrão(s) = 1500.
Limiteinferior do intervalode confiança= 3800 –(1,96*150) = 3506
Limitesuperior do intervalode confiança= 3800 + (1,96*150) = 4094
Considerandoque95% dos intervalosde confiançacontéma média
da população, podemosdizerqueesteintervaloentre 3506 e 4094
tem 95% de chance de contera médiareal do preçodo m
2
nos
imóveisno BairroW.

Intervalos de Confiança mais Exatos
Para amostraspequenas, ondeséumaestimativamenosconfiávelde σ
devemosconstruirnossointervalode confiançade maneiraum pouco
diferente.
Aoinvésde usar1.96 (escore-z), usamosum valorligeiramentemaior
pararefletirnossareduçãonaconfiança. Este valoré baseadona
distribuiçãot.

Relembrandoa aula passada:
Variânciae Grausde Liberdade
VARIÂNCIA –“médiado quadradodos desvios”
No entanto, comogeralmente
queremosusaro erronaamostrapara
estimaro erronapopulação,
dividiremoso SS pelo
nr. de observaçõesmenos1
(grausde liberdade).
Assim, aumentamosligeramentea
variânciaamostralparaproduzir
estimativasnãotendenciosas(mais
precisas) da variânciapopulacional
Estimativada variânciada
populaçãousandon amostras
aleatóriasx
iondei= 1, 2, ..., n.

Intervalos de Confiança mais Exatos
Nestecaso, o escorez ésubstituídopelarazãot.
A razãot usaumaestimativade erropadrãobaseadaemdados amostrais. À
medidaqueo tamanhoda amostraaumenta, o valorde ambasse torna
muitoparecido
(…)
t
(i;0,05)
gl= N-1
P = 1 –nívelde confiança
(áreanasextremidadesda
distribuiçãot)

Comparação entre Intervalos de
Confiança
Suponhaquetenhamosdoisoumaisgruposseparados,por
exemplo,osmunicípiosdoABC.Podemosconstruirum
intervalodeconfiançade95%paraamédiaparacadaum
dosgrupos,eentãoconstruirumgráficocomesses
intervaloscontraumeixocomumparaverificarseexiste
umainterseção(i.e.seexistemalgunsvaloresemcomum).
Seosintervalosnãosesobrepõem,entãotemos(pelo
menos)95%deconfiançadequeasverdadeirasmédiasnão
sãoiguais.

Intervalos de Confiança no SPSS
1.Abraoarquivo“AguaSNIS2010.sav”
2.NoSPSS,váemAnalisar>EstatísticasDescritivas>Explorar…
3.Selecioneavariável“Consumodeáguapercapita–pop
total”e,em“Estatísticas”,selecione“Descritivas”e95%

Intervalos de Confiança no SPSS
Limiteinferior= 24.77 –(1,96*0.25) = 24.28
Limitesuperior= 24.77 + (1,96*0.25) = 25.25

Intervalos de Confiança no SPSS

Intervalos de Confiança no SPSS
Assimetria

Intervalos de Confiança -Grupos
1.NoSPSS,váemAnalisar>EstatísticasDescritivas>Explorar…
2.Selecioneavariável“Consumodeáguapercapita–pop
total”nalistadevariáveisdependentseavariável“REGIAO”
emlistadefatores.
3.Em“Estatísticas…”,selecione“Descritivas”e95%

Intervalos de Confiança -Grupos

Intervalos de Confiança -Grupos

Osintervalos de confiança estãose sobrepondo?

Intervalos de Confiança -Grupos
•Comoodesviopadrãoeonúmerodecasos
afetamoerropadrãodecadaregião?
•Quaisregiõesseaproximammaisdeumacurva
normal?
•Comoissoafetaamedianaeamédia?

Atividade
Individual:
1.Quala diferençaentre desviopadrãoe erropadrão?
2.O queéum intervalode confiança?
3.Como interpretarum intervalode confiançade 95%?
Emgrupo:
4. Preparemumaplanilhacom no mínimo3 variáveisque vocês
pretendamutilizarpara o trabalhoda disciplina
5. Cadacomponentedo grupoescolheráumavariávele analisará,
no SPSS: histograma, a média, intervalode 95% de confiançapara
média, erropadrão, mediana, desviopadrão, assimetriae
curtose.