Conceitos Básicos de Estatística I

11,387 views 42 slides Jul 15, 2016
Slide 1
Slide 1 of 42
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10
Slide 11
11
Slide 12
12
Slide 13
13
Slide 14
14
Slide 15
15
Slide 16
16
Slide 17
17
Slide 18
18
Slide 19
19
Slide 20
20
Slide 21
21
Slide 22
22
Slide 23
23
Slide 24
24
Slide 25
25
Slide 26
26
Slide 27
27
Slide 28
28
Slide 29
29
Slide 30
30
Slide 31
31
Slide 32
32
Slide 33
33
Slide 34
34
Slide 35
35
Slide 36
36
Slide 37
37
Slide 38
38
Slide 39
39
Slide 40
40
Slide 41
41
Slide 42
42

About This Presentation

Medidas de Tendência Central
Desvio Padrão
Variância
Distribuições de Frequência e Probabilidade
Intervalos de Confiança
Apresentação disponível em: https://youtu.be/njXvCxskhdM
Aula de métodos e técnicas de análise da informação para planejamento, UFABC, junho de 2017
Gravação da a...


Slide Content

InferênciaEstatística:
ConceitosBásicosI
Introdução, Medidas de Tendência Central, Medidas de
Variabilidade, Distribuições de Frequência e Probabilidade
Vitor Vieira Vasconcelos
BH1350 –Métodose Técnicasde Análiseda Informaçãoparao Planejamento
Junhode 2016

O Que Estudaremosna Aula de Hoje
•Populaçõese Amostras
•Medidasde TendênciaCentral: Média, Moda, Mediana
•Medidasde Variabilidade: Variânciae DesvioPadrão
•CurvaNormal
•Distribuiçõesde Frequênciae Probabilidade
•Escorespadrão
•Cálculoda probabilidadesob a curvanormal

Como pesquisadores, estamosinteressadosem
investigarquestõesquese apliquema todauma
populaçãode pessoasoucoisas.
A populaçãopodesergeral(todososseres
humanos) oupequena(todososedifíciosde São
Caetano com maisde 15 andares)
Raramentetemosacessoaosdados de todaa
população, mas apenasde um subconjuntouma
amostra, queutilizamosparainferircoisassobre
todaa população
Populações& Amostras

Quantomaiora amostramaiora probabilidadede
elarefletira populaçãointeira
Amostrasaleatóriasda mesmapopulaçãopodem
fornecerresultadosligeiramentediferentes
Emmedia, resultadosde grandesamostrasdeverão
serbastantessimilares
Populações& Amostras

Métodocientíficoparatirarconclusõessobreos
parâmetrosda populaçãoa partirda coleta,
tratamentoe análisedos dados de umaamostra
recolhidadessapopulação.
InferênciaEstatística

Média como um modelo estatístico
Médiado númerode habitantespordomicílio
Nosajudaa representarsimplificadamente(modelar) este
aspectoparticular da realidade
Digamosqueeutenhaumaamostrade 5 domicílios, cada
qualcom osseguintesnúmerosde habitantes:
Emmédiatemos2,6 habitantespordomicílio
1 2 3 3 4

Média como um modelo estatístico
Médiado númerode habitantespordomicílio
Emmédiatemos2,6 habitantespordomicílio
(considerandonossaamostra)
Mas éimpossívelter2,6 habitantesemum domicílio!!!
A médiaéum valorhipotético, um MODELO
criadopararesumirnossosdados

Média como um modelo estatístico
Uma maneiraútilde descreverum grupocomo
um todo:
•Qualéa rendamédiadas famíliasresidentesna
Mooca?
•Qualéa alturamédiados edifíciosemSão
Caetano?
•Qualéo PIB médiodos municípioslocalizados
no arcodo desmatamento?

Inferência Estatística se
resumindo a uma equação…
Saída
i= (Modelo
i) + erro
i
Ouseja, osdados queobservamospodemser
previstospelomodeloqueescolhemospara
ajustarosdados maisum erro

Este modelo é preciso?
O quãodiferentenossosdados reaissãodo
modelocriado?
Média(2,6)
Desvios
(errodo modelo)
Nr. de
habitantes
Domicílio

Errototal = soma dos desvios
Nr. de
habitantes
Domicílio
Zero???
Para evitaro problemado erro
direcionado(ouseja, positivo
ounegativo), elevamoscada
erroaoquadrado
Usando os desvios para estimar a
precisão do modelo

Usando os desvios para estimar a
precisão do modelo
Soma dos errosaoquadrado
(SS)
Nr. de
habitantes
Domicílio
Boa medidade acuráciado
nossomodelo!
Sóque… quantomaisdados,
maiora SS.

Variância
Uma opção: DividirSS pelonúmerode observações(N) média
do quadradodo erroparaa amostra
EssamedidaéconhecidacomoVARIÂNCIA –“médiado quadrado
dos desvios”
No entanto, comogeralmente
queremosusaro erronaamostrapara
estimaro erronapopulação,
dividiremoso SS pelonr. de
observaçõesmenos1 (grausde
liberdade).
Assim, aumentamosligeramentea
variânciaamostralparaproduzir
estimativasnãotendenciosas(mais
precisas) da variânciapopulacional
Estimativada variânciada
populaçãousandon amostras
aleatóriasx
iondei= 1, 2, ..., n.

Um problemacom o usoda variânciacomomedidade erro: Elaé
expressaemunidadesquadradas(colocamoscadaerroao
quadradono cálculo)
No casodo exemplo, diríamos
queo quadradoda médiado
errodo nossomodelofoide
1,3 habitantes.
[Alteramosnossaunidadede medida!]
Estimativada variânciada
populaçãousandon amostras
aleatóriasx
iondei= 1, 2, ..., n.
Variância
Uma alternativa:
Tirara raizquadradada variância
DESVIO PADRÃO

Ésimplesmentea raizquadradada variância!
O desviopadrão(s) éumamedidade quãobema média
representaosdados! Médiados desviosa contarda média
Desvio Padrão
Quetodososescoressãoosmesmos!
Revelaa dispersãodos dados em
relaçãoàmédia.
s pequeno: observaçõesestãopróximas
da média
s grande: observaçõesestãodistantesda
média
s = 0: O quesignifica?

Médiacom boa aderênciaaosdados
Médias iguais,
mas desvios padrão diferentes
Médiacom pobreaderênciaaosdados
Nr. de
habitantes
Domicílio
Nr. de
habitantes
Domicílio

Distribuições de Frequências
HISTOGRAMA: Gráficocom osvaloresobservadosno eixo
horizontal, com barrasmostrandoquantasvezescadavalor
ocorreuno conjuntode dados
Útilparaavaliaras propriedadesde um conjuntode valores
Moda
Escorequeocorremais
frequentementeno
conjuntode dados

Curva Normal
Maioriados escoresestáemtornodo centroda distribuição. A
medidaquenosdistanciamosdo centro(média), a frequência
dos escoresdiminui.

Propriedades das Distribuições de Frequências
Uma distribuiçãopodese desviarde umanormal de 2 maneirasprincipais:
(1) Faltade simetria
ASSIMETRIA
(2) Achatamento
CURTOSE
Leptocúrtica Platicúrtica
PositivamenteAssimétrica NegativamenteAssimétrica
DESVIO PADRÃO
MAIOR
DESVIO PADRÃO
MENOR

Medidas de Tendência Central
MODA (Mo): Valormaisfrequenteemumadistribuição
MEDIANA (Me): Medidaqueseparaa distribuiçãoemduaspartes
iguais
MÉDIA (X): Soma de um conjuntode escoresdivididapelonúmero
total de escoresno conjunto
Medidasutilizadaspararepresentarum conjuntode valores

Curva Normal
Simétrica. Média, medianae modacoincidem!
Nemleptocúrtica, nemplaticúrticaMesocúrtica
Do picocentral, a curvacaigradualmenteemambasas extremidades,
chegandocadavezmaispertoda retabásica, semnuncatocá-la
Éum modeloteóricoouideal
quefoiobtidopormeiode uma
equaçãomatemáticae nãode
pesquisae coletade dados
Entretanto, éútilparasituação
reaisde pesquisapoisa
distribuiçãode muitos
fenômenosde interessede
pesquisaassume a forma da
curvanormal

Distribuições de Probabilidade
Distribuiçõesde frequênciapodemserusadasparaobteruma
ideiaaproximadada probabilidadede um escoreocorrer(ou
intervalo).
Exemploda AulaAnterior: Considerandoquea distribuiçãodo
númerode residentespordomicíliopossuia forma de uma
distribuiçãonormal, qualseriaa probabilidadede termos, nos
dados, um domicíliocom 4 habitantesoumenos?
PROBABILIDADE: NOÇÃO IMPORTANTE PARA A
TOMADA DE DECISÃO!!!

Distribuições de Probabilidade
Distribuiçõesde frequênciapodemserusadasparaobteruma
ideiaaproximadada probabilidadede um escoreocorrer(ou
intervalo).
Exemploda AulaAnterior: Considerandoquea distribuiçãodo
númerode residentespordomicíliopossuia forma de uma
distribuiçãonormal, qualseriaa probabilidadede termos, nos
dados, um domicíliocom 4 habitantesoumenos?
Para facilitarnossotrabalho, estatísticoselaboraramuma
forma matemáticaqueespecificaversõesidealizadasdas
distribuições: DISTRIBUIÇÕES DE PROBABILIDADE

Distribuições de Probabilidade
A distribuiçãode probabilidadesassociauma
probabilidadea cadaresultadonuméricode um
experimento, ouseja, dáa probabilidadede cada
valor(oude intervalode valores) de umavariável
aleatória.
Éanálogaa umadistribuiçãode frequência, excetoporser
baseadaemteoriaaoinvésde dados empíricos
(observaçõesdo mundoreal)
As probabilidadesrepresentama chance de cadaescore
ocorrer, diretamenteanálogaàsporcentagensemuma
distribuiçãode frequência.

A curva normal como uma
distribuição de probabilidade
A curvanormal éum ideal teórico.
No entanto, existemmuitasdistribuiçõesde dados reaisque
se aproximamda forma da curvanormal
Ésempreimportantechecar!!!!
Construirum histogramaéum bomcomeço!
Algumasvariáveisnasciênciassociais, nãose enquadram(rendae distribuição
etária, porexemplo)

A curva normal como uma
distribuição de probabilidade

A curva normal como uma
distribuição de probabilidade
ExemploAulaAnterior:
ResidentesporDomicílio
Média= 2,6; s = 1,14
1,46 3,742,6

Voltandoa nossapergunta:
Considerandoquea distribuiçãodo númerode residentespor
domicíliopossuia forma de umadistribuiçãonormal, qualseriaa
probabilidadede termos, nosdados, um domicíliocom 4
habitantesoumenos?
1,46 3,742,6
4
ResidentesporDomicílio
Média= 2,6; s = 1,14

Distribuição Normal Padrão
Jácalcularama probabilidadede certosescoresocorrerem
numadistribuiçãonormal com Média= 0 & Desviopadrão= 1
DISTRIBUIÇÃO NORMAL PADRÃO

Distribuição Normal Padrão
MAS… a distribuiçãodos meusdados nãoapresenta
média= zero e desviopadrão= 1!
E aí????
QUALQUER CONJUNTO DE DADOS PODE SER
CONVERTIDO EM UM CONJUNTO QUE TENHA MÉDIA
ZERO E DESVIO PADRÃO 1 !
OBA!!!!
Como fazer:
(1)Para centrardados emzero, pegamoscadaescoree
subtraímosdele a médiade todososescores.
(2)Dividimoso escoreresultantepelodesviopadrão
paraassegurarososresultadosterãoDP = 1
escores-z

Distribuição Normal Padrão
Voltandoa nossapergunta:
Considerandoquea distribuiçãodo númerode residentespor
domicíliopossuia forma de umadistribuiçãonormal, qualseriaa
probabilidadede termos, nosdados, um domicíliocom 4
habitantesoumenos?
Considerandoquea distribuiçãodos dados possaserdescritacomouma
distribuiçãonormal, com média= 2,6 e desviopadrão= 1,14
escores-z
PrimeiroPasso: Converter o valor4 em
um escore-z (4 -2,6)/1,14 = 1,23

Distribuição Normal Padrão
1,23

Distribuição Normal Padrão
Voltandoa nossapergunta:
Considerandoquea distribuiçãodo númerode residentespor
domicíliopossuia forma de umadistribuiçãonormal, qualseriaa
probabilidadede termos, nosdados, um domicíliocom 4
habitantesoumenos?
Considerandoquea distribuiçãodos dados possaserdescritacomouma
distribuiçãonormal, com média= 2,6 e desviopadrão= 1,14
escores-z
PrimeiroPasso: Converter o valor4 em
um escore-z (4 -2,6)/1,14 = 1,23
Segundo Passo: Verificartabela

z = 1,23
A probabilidade
de termosum
domicíliocom
até4 habitantes
éde 0,8907
(89,07%)
Complementarmente,
a probabilidadede
termosum domicílio
com maisde 4
habitanteséde 0,1093

z = 1,96
z= -1,96
Separaos2,5% do
topo/caudainferior da
distribuição.
Ou seja, 95% dos
escoresestãoentre
-1,96 e 1,96
Algunsz-escores
sãopontosde
corteque
destacampontos
importantesda
distribuição.

z = 1,96
z= -1,96
Separaos2,5% do
topo/caudainferior da
distribuição.
Ou seja, 95% dos
escoresestãoentre
-1,96 e 1,96
Algunsz-escores
sãopontosde
corteque
destacampontos
importantesda
distribuição.

z = -2,58
z= +2,58
99% dos escoresestão
entre -2,58 e 2,58
z = -3,29
z = +3,29
99,9% dos escoresestão
entre -3,29 e 3,29
Algunsz-escores
sãopontosde
corteque
destacampontos
importantesda
distribuição.

Prática
O Ambiente SPSS