Normalidadedos Dados
Assume-se queosdados foramobtidosde umaou
maispopulaçõesnormais.
Pesquisadoresverificamsuasamostras
(histogramae outros testes) e se a amostra
assemelha-se a umanormal, assume-se quea
populaçãotambémo é.
Explorando Dados no SPSS
1.DistribuiçãodosEscoreseValoresAtípicos
(verificaçãodanormalidadedosdados)
2.Corrigindoproblemasnosdados
3.Transformandodados
Explorando Dados
Analisar> EstatísticasDescritivas> Explorar> Estatísticas… >
Gráficos…
Explorando Dados
Explorando Dados
Explorando Dados
Positivamenteassimétrica
Leptocúrtica
A DistribuiçãoéNormal?
Converter assimetriae curtoseem
escores-z
Uma distribuiçãonormal deveráter
assimetriae curtosenulas. Serápossívelquea distribuição
da populaçãoassemelhe-se a umanormal?
Explorando Dados
Positivamenteassimétrica
Leptocúrtica
A DistribuiçãoéNormal?
z
s=(1.532-0)/0.037=41.4
z
k=(7.097-0)/0.074=95.9
Curtosee
Assimetria
Significativa
Converter assimetriae curtoseem
escores-z
Uma distribuiçãonormal deveráter
assimetriae curtosenulas. Serápossívelquea distribuição
da populaçãoassemelhe-se a umanormal?
Histograma -Outliers
Valoresatípicos(outliers)
Distorcema médiae
inflacionamo desviopadrão
Importanteparaa detecção
de erros, valoresatípicose
observaçãoda forma da
distribuiçãodos dados
z=2.671/.076=35.1
z=18.517/.153= 121
z=2.315/.126=18.4
z=14.757/.252= 58.6
No histogramaparecesimétrica, mas
nasestatísticasnão. Pq?
Boxplot (Caixa e Bigodes)
Discrepantes!!!
Poucos
outliers
Q-Q Plots
CORRIGINDO PROBLEMAS NOS
DADOS
Observou algum erro de digitação
que gostaria de corrigir?
Vápara o editor de dados, em“irpara o caso”
Editeo valordesejado
Reduzindo o Impacto de Outliers
1.Remover o caso
Sódeveserfeitose tiverumaboa razãoparaacreditarqueesse
valornãoérepresentanteda população.
2. Transformarosdados
Deveráserfeitono casode termosumadistribuiçãonãonormal.
Costumamreduziro impactode outliers.
3. Substituiro valor
O próximoescoremaisalto adicionadode 1
Inverter o valordo escore-z (adicionaro triplodo desvio
padrãoàmédiae substituiro valoratípicoporesse)
A médiamaisdoisdesviospadrão(variaçãodo métodoacima)
Transformação dos Dados
Para corrigirproblemasrelacionadosànão-normalidadeda
distribuiçãoouvaloresatípicos(outliers)
a. Transformaçãologaritmica(log(Xi))
Tomaro logaritmode um conjuntode números“esmaga” a caudadireitada
distribuição. É umaboa maneirade reduzirumaassimetriapositiva.
Atenção: Nãopodemosobterlogaritmode zero ouvaloresnegativos. Se tiver
zero nosdados, façalog(Xi+1)
Transformação dos Dados
Para corrigirproblemasrelacionadosànão-normalidadeda
distribuiçãoouvaloresatípicos(outliers)
b. Transformaçãoporradiciação(sqr(Xi))
Tomara raizquadradade valoresgrandestem efeitomaiordo queextraira
raizde efeitospequenos. Útilparadados com assimetriapositiva.
Problemascom númerosnegativos.
Somarum valoraoselementos(X + a) para nãotermaisnúmerosnegativos.
c. Transformaçãorecíproca(1/Xi)
Dividir1 porcadaescorereduzo impactodos grandesvalores. A variável
transformadateráum limiteinferior de zero (grandesvaloresficarão
próximosde zero.
Atenção: Este tipode transformaçãoreverteosescores(valoresgrandesse
tornarãopequenose vice-versa)
Para desinverter, utilizara fómula: 1/(X
máximo–X)
Transformando Dados no SPSS
Transformar> CalcularVariável
Transformando Dados no SPSS
Analisar> Frequências
Transformando Dados no SPSS
Analisar> Frequências
Transformando Dados no SPSS
CONSUMO LOG(CONSUMO + 1)
Transformando Dados no SPSS
Transformar> Calcularvariável
Transformando Dados no SPSS
CONSUMO SQRT(CONSUMO)
Transformando Dados no SPSS
Vocêspodemusaro comando“Transformar>
CalcularVariável” para realizaras mais
diversastransformaçõesnosdados!
Porexemplo: Normalizarosdados, calcular
taxase proporções, etc.
PARTE II
Realizar análises exploratórias sobre
os dados do trabalho do curso!!!
Para importarum arquivo.csvou.dbf parao SPSS, váem:
Arquivo> Abrir> Dados…
DICA: Vocêspodemimportaro arquivo.dbf quecompõeo
arquivovetorial(shapefile)
Atividade
Utilizandoosdados que pretendeusarno trabalhofinal da disciplina,
cadaintegrantedo grupoescolheráaomenosumavariávele faráas
atividadesa seguir.
a.Calculeas estatísticasdescritivasde umavariávelde suaescolha.
Expliquecadaumadelas.
b.Apresenteo histograma, box-plot e Q-Q Plot. Explique.
c.Realize alguma(s) transformação(ões) emumaoumaisvariáveis
selecionadas(ex: log, raizquadrada…). Expliquequalse
aproximoumaisda distribuiçãonormal.
d.Se houvergruposdistintos(bairros, distritos), repitaositens(a) e
(b) paracadagrupo. Compare intervalosde confiançada média
de umavariávelde interesse. Hásobreposições? O queisso
significa? Interprete!
Jáestamoselaborandoo trabalhofinal da disciplina!!!