Medidas de Tendência Central
Desvio Padrão
Variância
Distribuições de Frequência e Probabilidade
Intervalos de Confiança
Apresentação disponível em: https://youtu.be/njXvCxskhdM
Aula de métodos e técnicas de análise da informação para planejamento, UFABC, junho de 2017
Gravação da a...
Medidas de Tendência Central
Desvio Padrão
Variância
Distribuições de Frequência e Probabilidade
Intervalos de Confiança
Apresentação disponível em: https://youtu.be/njXvCxskhdM
Aula de métodos e técnicas de análise da informação para planejamento, UFABC, junho de 2017
Gravação da aula disponível em: https://youtu.be/bwmkSik9mYg
Size: 10.53 MB
Language: pt
Added: Jul 15, 2016
Slides: 42 pages
Slide Content
InferênciaEstatística:
ConceitosBásicosI
Introdução, Medidas de Tendência Central, Medidas de
Variabilidade, Distribuições de Frequência e Probabilidade
Vitor Vieira Vasconcelos
BH1350 –Métodose Técnicasde Análiseda Informaçãoparao Planejamento
Junhode 2016
O Que Estudaremosna Aula de Hoje
•Populaçõese Amostras
•Medidasde TendênciaCentral: Média, Moda, Mediana
•Medidasde Variabilidade: Variânciae DesvioPadrão
•CurvaNormal
•Distribuiçõesde Frequênciae Probabilidade
•Escorespadrão
•Cálculoda probabilidadesob a curvanormal
Como pesquisadores, estamosinteressadosem
investigarquestõesquese apliquema todauma
populaçãode pessoasoucoisas.
A populaçãopodesergeral(todososseres
humanos) oupequena(todososedifíciosde São
Caetano com maisde 15 andares)
Raramentetemosacessoaosdados de todaa
população, mas apenasde um subconjuntouma
amostra, queutilizamosparainferircoisassobre
todaa população
Populações& Amostras
Métodocientíficoparatirarconclusõessobreos
parâmetrosda populaçãoa partirda coleta,
tratamentoe análisedos dados de umaamostra
recolhidadessapopulação.
InferênciaEstatística
Média como um modelo estatístico
Médiado númerode habitantespordomicílio
Nosajudaa representarsimplificadamente(modelar) este
aspectoparticular da realidade
Digamosqueeutenhaumaamostrade 5 domicílios, cada
qualcom osseguintesnúmerosde habitantes:
Emmédiatemos2,6 habitantespordomicílio
1 2 3 3 4
Média como um modelo estatístico
Médiado númerode habitantespordomicílio
Emmédiatemos2,6 habitantespordomicílio
(considerandonossaamostra)
Mas éimpossívelter2,6 habitantesemum domicílio!!!
A médiaéum valorhipotético, um MODELO
criadopararesumirnossosdados
Média como um modelo estatístico
Uma maneiraútilde descreverum grupocomo
um todo:
•Qualéa rendamédiadas famíliasresidentesna
Mooca?
•Qualéa alturamédiados edifíciosemSão
Caetano?
•Qualéo PIB médiodos municípioslocalizados
no arcodo desmatamento?
Inferência Estatística se
resumindo a uma equação…
Saída
i= (Modelo
i) + erro
i
Ouseja, osdados queobservamospodemser
previstospelomodeloqueescolhemospara
ajustarosdados maisum erro
Este modelo é preciso?
O quãodiferentenossosdados reaissãodo
modelocriado?
Média(2,6)
Desvios
(errodo modelo)
Nr. de
habitantes
Domicílio
Errototal = soma dos desvios
Nr. de
habitantes
Domicílio
Zero???
Para evitaro problemado erro
direcionado(ouseja, positivo
ounegativo), elevamoscada
erroaoquadrado
Usando os desvios para estimar a
precisão do modelo
Usando os desvios para estimar a
precisão do modelo
Soma dos errosaoquadrado
(SS)
Nr. de
habitantes
Domicílio
Boa medidade acuráciado
nossomodelo!
Sóque… quantomaisdados,
maiora SS.
Variância
Uma opção: DividirSS pelonúmerode observações(N) média
do quadradodo erroparaa amostra
EssamedidaéconhecidacomoVARIÂNCIA –“médiado quadrado
dos desvios”
No entanto, comogeralmente
queremosusaro erronaamostrapara
estimaro erronapopulação,
dividiremoso SS pelonr. de
observaçõesmenos1 (grausde
liberdade).
Assim, aumentamosligeramentea
variânciaamostralparaproduzir
estimativasnãotendenciosas(mais
precisas) da variânciapopulacional
Estimativada variânciada
populaçãousandon amostras
aleatóriasx
iondei= 1, 2, ..., n.
Um problemacom o usoda variânciacomomedidade erro: Elaé
expressaemunidadesquadradas(colocamoscadaerroao
quadradono cálculo)
No casodo exemplo, diríamos
queo quadradoda médiado
errodo nossomodelofoide
1,3 habitantes.
[Alteramosnossaunidadede medida!]
Estimativada variânciada
populaçãousandon amostras
aleatóriasx
iondei= 1, 2, ..., n.
Variância
Uma alternativa:
Tirara raizquadradada variância
DESVIO PADRÃO
Ésimplesmentea raizquadradada variância!
O desviopadrão(s) éumamedidade quãobema média
representaosdados! Médiados desviosa contarda média
Desvio Padrão
Quetodososescoressãoosmesmos!
Revelaa dispersãodos dados em
relaçãoàmédia.
s pequeno: observaçõesestãopróximas
da média
s grande: observaçõesestãodistantesda
média
s = 0: O quesignifica?
Médiacom boa aderênciaaosdados
Médias iguais,
mas desvios padrão diferentes
Médiacom pobreaderênciaaosdados
Nr. de
habitantes
Domicílio
Nr. de
habitantes
Domicílio
Distribuições de Frequências
HISTOGRAMA: Gráficocom osvaloresobservadosno eixo
horizontal, com barrasmostrandoquantasvezescadavalor
ocorreuno conjuntode dados
Útilparaavaliaras propriedadesde um conjuntode valores
Moda
Escorequeocorremais
frequentementeno
conjuntode dados
Curva Normal
Maioriados escoresestáemtornodo centroda distribuição. A
medidaquenosdistanciamosdo centro(média), a frequência
dos escoresdiminui.
Propriedades das Distribuições de Frequências
Uma distribuiçãopodese desviarde umanormal de 2 maneirasprincipais:
(1) Faltade simetria
ASSIMETRIA
(2) Achatamento
CURTOSE
Leptocúrtica Platicúrtica
PositivamenteAssimétrica NegativamenteAssimétrica
DESVIO PADRÃO
MAIOR
DESVIO PADRÃO
MENOR
Medidas de Tendência Central
MODA (Mo): Valormaisfrequenteemumadistribuição
MEDIANA (Me): Medidaqueseparaa distribuiçãoemduaspartes
iguais
MÉDIA (X): Soma de um conjuntode escoresdivididapelonúmero
total de escoresno conjunto
Medidasutilizadaspararepresentarum conjuntode valores
Curva Normal
Simétrica. Média, medianae modacoincidem!
Nemleptocúrtica, nemplaticúrticaMesocúrtica
Do picocentral, a curvacaigradualmenteemambasas extremidades,
chegandocadavezmaispertoda retabásica, semnuncatocá-la
Éum modeloteóricoouideal
quefoiobtidopormeiode uma
equaçãomatemáticae nãode
pesquisae coletade dados
Entretanto, éútilparasituação
reaisde pesquisapoisa
distribuiçãode muitos
fenômenosde interessede
pesquisaassume a forma da
curvanormal
Distribuições de Probabilidade
Distribuiçõesde frequênciapodemserusadasparaobteruma
ideiaaproximadada probabilidadede um escoreocorrer(ou
intervalo).
Exemploda AulaAnterior: Considerandoquea distribuiçãodo
númerode residentespordomicíliopossuia forma de uma
distribuiçãonormal, qualseriaa probabilidadede termos, nos
dados, um domicíliocom 4 habitantesoumenos?
PROBABILIDADE: NOÇÃO IMPORTANTE PARA A
TOMADA DE DECISÃO!!!
Distribuições de Probabilidade
Distribuiçõesde frequênciapodemserusadasparaobteruma
ideiaaproximadada probabilidadede um escoreocorrer(ou
intervalo).
Exemploda AulaAnterior: Considerandoquea distribuiçãodo
númerode residentespordomicíliopossuia forma de uma
distribuiçãonormal, qualseriaa probabilidadede termos, nos
dados, um domicíliocom 4 habitantesoumenos?
Para facilitarnossotrabalho, estatísticoselaboraramuma
forma matemáticaqueespecificaversõesidealizadasdas
distribuições: DISTRIBUIÇÕES DE PROBABILIDADE
Distribuições de Probabilidade
A distribuiçãode probabilidadesassociauma
probabilidadea cadaresultadonuméricode um
experimento, ouseja, dáa probabilidadede cada
valor(oude intervalode valores) de umavariável
aleatória.
Éanálogaa umadistribuiçãode frequência, excetoporser
baseadaemteoriaaoinvésde dados empíricos
(observaçõesdo mundoreal)
As probabilidadesrepresentama chance de cadaescore
ocorrer, diretamenteanálogaàsporcentagensemuma
distribuiçãode frequência.
A curva normal como uma
distribuição de probabilidade
A curvanormal éum ideal teórico.
No entanto, existemmuitasdistribuiçõesde dados reaisque
se aproximamda forma da curvanormal
Ésempreimportantechecar!!!!
Construirum histogramaéum bomcomeço!
Algumasvariáveisnasciênciassociais, nãose enquadram(rendae distribuição
etária, porexemplo)
A curva normal como uma
distribuição de probabilidade
A curva normal como uma
distribuição de probabilidade
ExemploAulaAnterior:
ResidentesporDomicílio
Média= 2,6; s = 1,14
1,46 3,742,6
Voltandoa nossapergunta:
Considerandoquea distribuiçãodo númerode residentespor
domicíliopossuia forma de umadistribuiçãonormal, qualseriaa
probabilidadede termos, nosdados, um domicíliocom 4
habitantesoumenos?
1,46 3,742,6
4
ResidentesporDomicílio
Média= 2,6; s = 1,14
Distribuição Normal Padrão
Jácalcularama probabilidadede certosescoresocorrerem
numadistribuiçãonormal com Média= 0 & Desviopadrão= 1
DISTRIBUIÇÃO NORMAL PADRÃO
Distribuição Normal Padrão
MAS… a distribuiçãodos meusdados nãoapresenta
média= zero e desviopadrão= 1!
E aí????
QUALQUER CONJUNTO DE DADOS PODE SER
CONVERTIDO EM UM CONJUNTO QUE TENHA MÉDIA
ZERO E DESVIO PADRÃO 1 !
OBA!!!!
Como fazer:
(1)Para centrardados emzero, pegamoscadaescoree
subtraímosdele a médiade todososescores.
(2)Dividimoso escoreresultantepelodesviopadrão
paraassegurarososresultadosterãoDP = 1
escores-z
Distribuição Normal Padrão
Voltandoa nossapergunta:
Considerandoquea distribuiçãodo númerode residentespor
domicíliopossuia forma de umadistribuiçãonormal, qualseriaa
probabilidadede termos, nosdados, um domicíliocom 4
habitantesoumenos?
Considerandoquea distribuiçãodos dados possaserdescritacomouma
distribuiçãonormal, com média= 2,6 e desviopadrão= 1,14
escores-z
PrimeiroPasso: Converter o valor4 em
um escore-z (4 -2,6)/1,14 = 1,23
Distribuição Normal Padrão
1,23
Distribuição Normal Padrão
Voltandoa nossapergunta:
Considerandoquea distribuiçãodo númerode residentespor
domicíliopossuia forma de umadistribuiçãonormal, qualseriaa
probabilidadede termos, nosdados, um domicíliocom 4
habitantesoumenos?
Considerandoquea distribuiçãodos dados possaserdescritacomouma
distribuiçãonormal, com média= 2,6 e desviopadrão= 1,14
escores-z
PrimeiroPasso: Converter o valor4 em
um escore-z (4 -2,6)/1,14 = 1,23
Segundo Passo: Verificartabela
z = 1,23
A probabilidade
de termosum
domicíliocom
até4 habitantes
éde 0,8907
(89,07%)
Complementarmente,
a probabilidadede
termosum domicílio
com maisde 4
habitanteséde 0,1093
z = 1,96
z= -1,96
Separaos2,5% do
topo/caudainferior da
distribuição.
Ou seja, 95% dos
escoresestãoentre
-1,96 e 1,96
Algunsz-escores
sãopontosde
corteque
destacampontos
importantesda
distribuição.
z = 1,96
z= -1,96
Separaos2,5% do
topo/caudainferior da
distribuição.
Ou seja, 95% dos
escoresestãoentre
-1,96 e 1,96
Algunsz-escores
sãopontosde
corteque
destacampontos
importantesda
distribuição.
z = -2,58
z= +2,58
99% dos escoresestão
entre -2,58 e 2,58
z = -3,29
z = +3,29
99,9% dos escoresestão
entre -3,29 e 3,29
Algunsz-escores
sãopontosde
corteque
destacampontos
importantesda
distribuição.