Estatística Descritiva (1).pdfeeeeeeeeee

joaoteixeira636046 3 views 77 slides Sep 23, 2025
Slide 1
Slide 1 of 77
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10
Slide 11
11
Slide 12
12
Slide 13
13
Slide 14
14
Slide 15
15
Slide 16
16
Slide 17
17
Slide 18
18
Slide 19
19
Slide 20
20
Slide 21
21
Slide 22
22
Slide 23
23
Slide 24
24
Slide 25
25
Slide 26
26
Slide 27
27
Slide 28
28
Slide 29
29
Slide 30
30
Slide 31
31
Slide 32
32
Slide 33
33
Slide 34
34
Slide 35
35
Slide 36
36
Slide 37
37
Slide 38
38
Slide 39
39
Slide 40
40
Slide 41
41
Slide 42
42
Slide 43
43
Slide 44
44
Slide 45
45
Slide 46
46
Slide 47
47
Slide 48
48
Slide 49
49
Slide 50
50
Slide 51
51
Slide 52
52
Slide 53
53
Slide 54
54
Slide 55
55
Slide 56
56
Slide 57
57
Slide 58
58
Slide 59
59
Slide 60
60
Slide 61
61
Slide 62
62
Slide 63
63
Slide 64
64
Slide 65
65
Slide 66
66
Slide 67
67
Slide 68
68
Slide 69
69
Slide 70
70
Slide 71
71
Slide 72
72
Slide 73
73
Slide 74
74
Slide 75
75
Slide 76
76
Slide 77
77

About This Presentation

ee


Slide Content

Estatística Descritiva
Professor Dr. Geraldo Veríssimo de Souza Barbosa
UFAL
CECA
UNIVERSIDADE FEDERAL DE ALAGOAS
CAMPUS DE ENGENHARIAS E CIÊNCIAS AGRÁRIAS
DISCIPLINA: ESTATÍSTICA GERAL

Estatística Descritiva: conjunto de
técnicas que permite descrever e
resumir os dados de uma
característica (variável)

▪O objetivo da Estatística Descritiva (dedutiva) é a
redução de dados
▪Sintetizamos numerosos dados a algumas
informações
▪São as tabelas de frequências, gráficos, médias,
desvios padrões, índices, taxas, coeficientes, etc.

Desempenho geral dos estudantes de Agronomia do
CECA/UFAL no ENADE/2019

Desempenho geral dos estudantes de Agronomia do
CECA/UFAL no ENADE/2019

▪É uma representaçãodas informações em forma
matricial, isto é, em linhas e colunas. Exemplo:
TABELA
Número de alunos de Estatística Geral da turma 2016.2, de acordo
com o ano de entrada
Ano de entrada
do aluno
Nº de alunos
2010 1
2011 0
2012 1
2013 1
2014 4
2015 33
Total 40
Essa é uma tabela bidimensional, tem linhas e colunas.

O título explica o
conteúdo da tabela

O Cabeçalho especifica o
conteúdo das colunas
Corpo da tabela: são os dados (as informações)

▪Vamos considerar o exemplo de um conjunto de
dados de duas variáveis mensuradas em 20
plântulas de cana-de-açúcar - Número de Folhas por
Plântula (NFP) e Altura da Plântula (AP), em cm
i NFP AP
1 6 88,2
2 4 59,4
3 4 64,6
4 7 91,3
5 5 77,2
6 6 85,0
7 6 72,3
8 6 80,1
9 6 75,0
10 8 102,3
i NFP AP
11 7 95,0
12 6 78,7
13 7 81,4
14 5 70,0
15 6 79,5
16 6 71,2
17 8 97,5
18 6 85,0
19 5 74,1
20 6 76,3

▪Distribuição de frequências para dados de variáveis
discretas
▪Os dados são agrupados, do menor para o maior valor,
exibindo cada valor observado, suas frequências
absolutas e relativas
▪Não há perda de informações

▪Aplicação para os dados de NFP
▪Rol de NFP (dados em ordem crescente)

4 4 5 5 5 6 6 6 6 6 6 6 6 6 6 7 7 7 8 8

NFP
4
5
6
7
8
f
2
3
10
3
2
fr (%)
10
15
50
15
10
fa
2
5
15
18
20
fra (%)
10
25
75
90
100
▪ Distribuição de frequências para a variável NFP
f: frequência; fr: frequência relativa; fa: frequência
acumulada; fra: frequência relativa acumulada

▪ Distribuição de frequências para a variável NFP
NFP f fr (%) fafra (%)
4 2 10 2 10
5 3 15 5 25
6 10 50 15 75
7 3 15 18 90
8 2 10 20 100
f: frequência; fr: frequência relativa; fa: frequência acumulada;
fra: frequência relativa acumulada

•O NFP variou entre 4 e 8
• O valor mais frequente de NFP foi 6
• 10% das plântulas apresentaram 8 folhas por plântula
•90% das plântulas apresentaram no máximo 7 folhas por
plântula
•80% das plântulas apresentaram entre 5 e 7 folhas por plântula
Algumas interpretações

Histograma de frequências para NFP

Histograma de frequências relativas para NFP

Polígono de frequências relativas
acumuladas para NFP (ogiva de NFP)

Distribuição de frequências para dados de
variáveis contínuas
▪Os dados são agrupados em classes
▪Para cada classe são apresentadas as frequências
absolutas e relativas
▪ Nesse caso há perda de informações

▪Devemos ter classes com intervalos que facilitem a
interpretação dos resultados
▪ É comum considerar entre 5 e 15 classes, pois abaixo de 5
pode ocultar detalhes importantes e acima de 15 torna a
apresentação demasiadamente detalhada
▪Uma regra prática para determinar o número de classes é tomar
a raiz quadrada do número de dados e ajustar para o intervalo
de 5 a 15 classes

▪Vamos considerar os dados de AP
▪Rol (dados em ordem crescente)
59,464,670,071,272,374,175,076,377,278,7
79,580,181,485,085,088,291,395,097,5102,3

▪Temos 20 dados de AP. Tomando-se a raiz quadrada de
20, podemos considerar 5 classes
▪O maior valor é 102,3 cm e o menor valor é 59,4 cm
▪A diferença entre o maior valor e o menor valor é de
42,9 cm (amplitude dos dados)
▪Dividindo-se essa amplitude dos dados (42,9 cm) por 5
classes, encontramos a amplitude de cada classe (8,58
cm)
▪Vamos aproximar a amplitude de cada classe para 10
cm (facilitará as interpretações)
▪ Nesse caso consideramos o limite inferior da primeira
classe abaixo do menor valor

▪ Distribuição de frequências para a variável Altura
da Planta (AP)
PM: ponto médio da classe; f: frequência; fr: frequência relativa;
fa: frequência acumulada; fra: frequência relativa acumulada
Classe AP
(55 a 65]
(65 a 75]
(75 a 85]
(85 a 95]
(95 a 105]
PM
60
70
80
90
100
f
2
5
8
3
2
fr (%)
10
25
40
15
10
fa
2
7
15
18
20
fra (%)
10
35
75
90
100

▪ Distribuição de frequências para a variável Altura
da Planta (AP)
Classe APPM f fr (%) fafra (%)
(55 a 65]60 2 10 2 10
(65 a 75]70 5 25 7 35
(75 a 85]80 8 40 15 75
(85 a 95]90 3 15 18 90
(95 a 105]100 2 10 20 100
PM: ponto médio da classe; f: frequência; fr: frequência relativa;
fa: frequência acumulada; fra: frequência relativa acumulada

•A classe de AP mais frequente foi (75 a 85]
• 10% das plântulas apresentaram altura entre 95 e 105 cm
• 75% das plântulas apresentaram altura de no máximo 85 cm
•80% das plântulas apresentaram altura entre 65 e 95 cm
Algumas interpretações

Histograma de frequências para AP

Histograma de frequências relativas para AP

Polígono de frequências relativas acumuladas
para AP (ogiva de AP)

•Medidas de posição ou de tendência
central dos dados
▪São usadas para indicar valores que
representem melhor o conjunto de dados

▪É a mais importante medida de posição dos dados
▪É o ponto de equilíbrio dos dados

Na População: x
1, x
2,...,x
N
Média = μ =
??????�+??????�+⋯+????????????
??????
=
σ????????????
??????

MÉDIA (μ ou m)

MÉDIA (μ ou m)
Na Amostra: x
1, x
2,...,x
n
Média = ഥ?????? = m =
??????
�+??????
�+⋯+??????
�
�
=
σ??????
??????
�

Média dos dados da amostra de NFP
m =
�+�+⋯+�+�
��
=
���
��
=�

Média dos dados da amostra de AP
m =
��,�+��,�+⋯+��,�+��,�
��
=
�.���,�
��
=��,�

▪É usada quando os dados estiverem agrupados
▪Se tivermos n observações da variável X, das quais n
1
são iguais a x
1, n
2 são iguais a x
2, etc, n
k iguais a x
k,
então:

MÉDIA Ponderada (m
p)

m
p =
(�
�)(??????
�)+(�
�)(??????
�)+⋯+(�
??????)(??????
??????)
��+��+⋯+�??????

Observe que �
�+�
�+⋯+�
??????=Ʃ�
??????=�

Média ponderada dos dados de NFP

m
p =
��+��+���+��+(�)(�)
�+�+��+�+�
=
���
��
=�
▪No caso de variáveis discretas não há perda de
informação. A média aritmética é igual a média
ponderada

Média ponderada dos dados de AP

m
p =
���+���+���+���+(�)(���)
�+�+�+�+�
=
�.���
��
=��,�
▪No caso de variáveis contínuas há perda de
informação. A média aritmética é diferente da média
ponderada

▪Para dados ordenados (Rol), a mediana é o valor que
divide a série dos dados em duas partes iguais
▪ Metade dos valores se situa abaixo e a outra metade
acima da mediana
▪Para n ímpar a mediana será o valor central e para n par
a mediana será a média dos dois valores centrais
▪É uma medida estatística menos importante que a
média
MEDIANA (M
d)

▪Para os dados de NFP:
M
d
=
�+�
�
=�
Uma regra prática usa a distribuição de frequências dos
dados. Tomar o valor de NFP quando a fra for de 50%
MEDIANA (M
d)
4 4 5 5 5 6 6 6 6 6 6 6 6 6 6 7 7 7 8 8

▪Distribuição de frequências para a variável NFP
NFP f fr (%)fafra (%)
4 2 10 2 10
5 3 15 5 25
6 10 50 15 75
7 3 15 18 90
8 2 10 20 100
f: frequência; fr: frequência relativa; fa: frequência absoluta;
fra: frequência relativa absoluta.
50%Md = 6

▪M
d
=
��,�+��,�
�
=��,�
MEDIANA (M
d)
59,464,670,071,272,374,175,076,377,278,7
79,580,181,485,085,088,291,395,097,5102,3
▪ Para os dados de AP (Rol):

▪Para variáveis contínuas é mais apropriado apresentar
a classe mediana
▪Na distribuição de frequências dos dados tomamos a
classe quando a fra for de 50%
▪Classe mediana de AP: (75 a 85]

MEDIANA (M
d)

▪Distribuição de frequências para a variável Altura da Planta (AP)
Classe
AP PM ffr (%)fafra (%)
(55 a 65]60 2 10 2 10
(65 a 75]70 5 25 7 35
(75 a 85]80 8 40 15 75
(85 a 95]90 3 15 18 90
(95 a 105]100 2 10 20100
PM: ponto médio da classe; f: frequência; fr: frequência relativa;
fa: frequência acumulada; fra: frequência relativa acumulada.
50%Classe mediana

▪É o valor mais frequente em uma série de dados
▪É a medida de posição menos útil
▪Para variáveis contínuas, é mais indicado usar a
classe modal, ou aquela com maior frequência

MODA (Mo)

▪Para a variável NFP a Moda é 6 folhas por plântula
▪Para a variável AP, a classe modal é (75 a 85] cm

MODA (Mo)

Medidas de dispersão ou de variabilidade
dos dados
▪Indicam se os valores estão próximos
ou separados uns dos outros

Medidas de dispersão ou de variabilidade dos
dados
Exemplo: sejam as amostras A e Bi x
i
1 2,5
2 3
3 3,5
Amostra A i x
i
1 2
2 3
3 4
Amostra B

Intervalo ou amplitude (Δ)
▪É a diferença entre o maior e o menor
valor
▪Para a amostra A:
▪Mín = 2,5 ; Máx = 3,5 ; Δ = 3,5 – 2,5 = 1
▪Para a amostra B:
▪Mín = 2 ; Máx = 4 ; Δ = 4 – 2 = 2

Desvio, erro ou afastamento da média (e
i)
É a diferença entre qualquer valor do
conjunto de dados e a média

e
i = x
i - m

Desvio, erro ou afastamento da média (e
i)
Para a amostra A: m = 3


Obs: Soma dos erros = 0; média dos erros = 0
e
i = x
i - mi x
i e
i
1 2,5-0,5
2 3 0,0
3 3,50,5
Amostra A

Desvio, erro ou afastamento da média (e
i)
Para a amostra B: m = 3


Obs: Soma dos erros = 0; média dos erros = 0
e
i = x
i - mi x
i e
i
1 2 -1
2 3 0
3 4 1
Amostra B

VARIÂNCIA (σ
2
ou s
2
)
Uma das alternativa para evitar que a soma
dos desvios seja nula é considerarmos
seus quadrados. A variância é, pois, a
média dos desvios quadráticos.

VARIÂNCIA (σ
2
ou s
2
)
Na população (σ
2
):
σ
2
=
σ??????
??????
2
??????
=
σ??????
??????
2
−(σ??????
??????)
2
/??????
??????

VARIÂNCIA (σ
2
ou s
2
)
Na amostra (s
2
):
O termo (n-1) do denominador da variância, chama-se
graus de liberdade (gl)
??????
2
=
σ??????
??????
2
??????−1
=
σ??????
??????
2
−(σ??????
??????)
2
/??????
??????−1

VARIÂNCIA (σ
2
ou s
2
)
Para a amostra A:
??????
2
=
σ??????
??????
2
??????−1
=
0,5
2
= 0,25
27,5−(9)
2
/3
3−1
=
0,5
2
=0,25??????
2
=
σ??????
??????
2
−(σ??????
??????)
2
/??????
??????−1
=i x
i e
ie
i
2
x
i
2
1 2,5-0,50,256,25
2 3 0,00,009,00
3 3,50,50,2512,25
Total 9 00,5027,50
m 3 0
Amostra A

VARIÂNCIA (σ
2
ou s
2
)
Para a amostra B:
??????
2
=
σ??????
??????
2
??????−1
=
2
2
= 1,00
29−(9)
2
/3
3−1
=
2
2
=1,00??????
2
=
σ??????
??????
2
−(σ??????
??????)
2
/??????
??????−1
=i x
i e
i e
i
2
x
i
2
1 2 -1 14,00
2 3 0 09,00
3 4 1 116,00
Total 9 0 229,00
m 3 0
Amostra B

DESVIO PADRÃO (σ ou s)
O problema da variância é que ela é uma
medida com escala quadrática
Desvio padrão = ????????????�??????â�??????????????????
Para encontrar uma medida com a escala
original dos dados, devemos extrair a raiz
quadrada da variância, que é o desvio
padrão

DESVIO PADRÃO (σ ou s)
Para a amostra A: s = �,�� = 0,50
Para a amostra B: s = �,�� = 1,00

ERRO PADRÃO DA MÉDIA - s (m) ou s (ഥ??????)
É uma medida de variação da média
s (m) = s (ഥ??????) =
�
�
Quando tivermos uma amostra com n dados,
uma estimativa da média equivalente a m ou ഥ?????? e
estimativa de desvio padrão de s, o erro padrão
da média é obtido pela expressão:

ERRO PADRÃO DA MÉDIA - s (m) ou s (ഥ??????)
Para a amostra A: s (m) =
�,�
�
= 0,29
Para amostra B: s (m) =
�,�
�
= 0,58

Coeficiente de Variação (CV)
É uma medida relativa de variação dos
dados
CV (%) =
��� �
�
Representa, em percentagem, o quanto o
desvio padrão vale em relação à média

Coeficiente de Variação (CV)
Para a amostra A: CV =
��� (�,�)
�
= 16,67%
Para amostra B: CV =
��� (�,�)
�
= 33,33%

Interpretação do CV
O CV mede a precisão dos dados
CV( %) Variação Precisão
<5 Muito baixaMuito alta
5 a 10 Baixa Alta
10 a 20 Média Média
20 a 30 Alta Baixa
>30 Muito altaMuito baixa

Impreciso e Inexato Preciso e Exato Preciso e Inexato Impreciso e exato PRECISÃO e EXATIDÃO
G.V.S.BARBOSA - CEP 2016

Prática: uso de calculadora

SEPARATRIZES (QUARTIS, DECIS E
PERCENTIS)
▪ Dividem a série dos dados ordenados (Rol)
em partes iguais.

Obs: No cálculo da separatriz, quando a ordem
coincidir com um número inteiro i o valor a ser usado é
o da média aritmética entre os dados que ocupam as
posições i e i+1. Quando a ordem não for um número
inteiro a regra é arredondar para a posição do número
inteiro acima da ordem e tomar o valor correspondente.
SEPARATRIZES (QUARTIS, DECIS E PERCENTIS)Valor x1x2x3...xn
Ordem (i)1 2 3...n
Rol dos dados

Quartis (Q)
Dividem a série de dados em quatro partes iguais. São três quartis.
Q
1 = 1º quartil, deixa 25% dos dados abaixo e 75% acima dele.
Q
2 = 2º quartil, deixa 50% dos dados abaixo e 50% acima dele.
Q
3 = 3º quartil, deixa 75% dos dados abaixo e 25% acima dele.

Exemplo de Quartis para NFP (n=20)
Q
1 = 1º quartil; Ordem = n/4 = 20/4 = 5, então Q
1 = (5+6)/2 = 5,5
Q
2 = 2º quartil; Ordem = 2n/4 = 40/4 = 10, então Q
2 = (6+6)/2 = 6
Q
3 = 3º quartil; Ordem = 3n/4 = 60/4 = 15, então Q
3 = (6+7)/2 = 6,5NFP 4 4 5 5 5 6 6 6 6 6
Ordem 1 2 3 4 5 6 7 8 9 10
NFP 6 6 6 6 6 7 7 7 8 8
Ordem 111213141516171819 20

Q
1 = 1º quartil; Ordem = n/4 = 20/4 = 5, então Q
1 = (72,3+74,1)/2 = 73,2
Q
2 = 2º quartil; Ordem = 2n/4 = 40/4 = 10, então Q
2 = (78,7+79,5)/2 = 79,1
Q
3 = 3º quartil; Ordem = 3n/4 = 60/4 = 15, então Q
3 = (85+88,2)/2 = 86,6AP59,464,670,071,272,374,175,076,377,278,7
Ordem 1 2 3 4 5 6 7 8 9 10
AP79,580,181,485,085,088,291,395,097,5102,3
Ordem111213141516171819 20
Exemplo de Quartis para AP (n=20)

Decis (D)
Dividem a série de dados em dez partes iguais.
D
1 = 1º decil, deixa 10% dos dados abaixo e 90% acima dele.
D
2 = 2º decil, deixa 20% dos dados abaixo e 80% acima dele.
......... ...............................................................................................
D
9 = 9º decil, deixa 90% dos dados abaixo e 10% acima dele.

D
2 = 2º decil; Ordem = 2n/10 = 40/10 = 4, então D
2 = (5+5)/2 = 5
D
8 = 8º decil; Ordem = 8n/10 = 160/10 = 16, então D
8 = (7+7)/2 = 7NFP 4 4 5 5 5 6 6 6 6 6
Ordem 1 2 3 4 5 6 7 8 9 10
NFP 6 6 6 6 6 7 7 7 8 8
Ordem 111213141516171819 20
Exemplo de Decis para NFP (n=20)

D
1 = 1º decil; Ordem = n/10 = 20/10 = 2, então D
1 = (64,6+70)/2 = 67,3
D
9 = 9º decil; Ordem = 9n/10 = 180/10 = 18, então D9 = (95+97,5)/2 = 96,3AP59,464,670,071,272,374,175,076,377,278,7
Ordem 1 2 3 4 5 6 7 8 9 10
AP79,580,181,485,085,088,291,395,097,5102,3
Ordem111213141516171819 20
Exemplo de Decis para AP (n=20)

PERCENTIS (P)
Dividem a série dos dados em 100 partes iguais.

P
1 = 1º percentil, deixa 1% dos dados abaixo e 99% acima dele.
.............................................................................................................
P
99 = 99º percentil, deixa 99% dos dados abaixo e 1% acima dele.

P
32 = 32º percentil; Ordem = 32n/100 = 640/100 = 6,4
então P
32 será o valor correspondente a ordem 7, ou P
32 = 6
P
85 = 85º percentil; Ordem = 85n/100 = 1700/100 = 17
então P
85 = (7+7)/2 = 7NFP 4 4 5 5 5 6 6 6 6 6
Ordem 1 2 3 4 5 6 7 8 9 10
NFP 6 6 6 6 6 7 7 7 8 8
Ordem 111213141516171819 20
Exemplo de Percentis para NFP (n=20)

P
16 = 16º percentil; Ordem = 16n/100 = 320/100 = 3,2
então P
16 será o valor de ordem 4 ou P
16 = 71,2
P
57 = 57º percentil; Ordem = 57n/100 = 1140/100 = 11,4
então P
57 será o valor de ordem 12 ou P
57 = 80,1AP59,464,670,071,272,374,175,076,377,278,7
Ordem 1 2 3 4 5 6 7 8 9 10
AP79,580,181,485,085,088,291,395,097,5102,3
Ordem111213141516171819 20
Exemplo de Percentis para AP (n=20)

SEPARATRIZES (QUARTIS, DECIS E
PERCENTIS)
▪Uma regra prática para obter as separatrizes
aproximadas é com base no valor
correspondente à frequência relativa
acumulada.

NFP ffr (%)fafra (%)
4 2 10 2 10
5 3 15 5 25
6 10 50 15 75
7 3 15 18 90
8 2 10 20 100 EXEMPLOS DE SEPARATRIZES (QUARTIS, DECIS E PERCENTIS)Separatriz NFP
Q1 5
Q2 6
Q3 6
D2 5
D8 7
P32 6
P85 7

Classe APPM f fr (%)fafra (%)
(55 a 65]60 2 10 2 10
(65 a 75]70 5 25 7 35
(75 a 85]80 8 40 15 75
(85 a 95]90 3 15 18 90
(95 a 105]100 2 10 20 100 EXEMPLOS DE SEPARATRIZES (QUARTIS, DECIS E PERCENTIS)
Usando a classeSeparatrizClasse AP
Q1 (65 a 75]
Q2 (75 a 85]
Q3 (75 a 85]
D1 (55 a 65]
D9 (85 a 95]
P16 (65 a 75]
P57 (75 a 85]

Resumo estatístico para a variável NFP
Número de dados n 20
Mínimo Mín 4
Máximo Máx 8
Amplitude A 4
Total ∑x 120
Média m 6
Média ponderada
(Valor x frequências)
Moda m
o 6
Mediana Med 6
Variância s
2
1,16
Desvio padrão s 1,08
Erro padrão da média s(m)0,24
Coeficiente de Variação CV (%)17,93
Quartil inferior q
1 5,5
Quartil superior q
3 6,5
Segundo decil d
2 5
Oitavo decil d
8 7
32º percentil p
32 6
m
p 6

Resumo estatístico para a variável AP
Número de dados n 20
Mínimo Mín59,4
Máximo Máx102,3
Amplitude A 42,9
Total ∑x1604,1
Média m80,205
Média ponderada
(PM x frequências)
[75 a 85]
Mediana 79,1
Variância s
2
118,74
Desvio padrão s10,90
Erro padrão da médias(m)2,44
Coeficiente de Variação CV (%)13,6
Quartil inferior q
173,20
Quartil superior q
386,60
Primeiro decil d
167,30
Nono decil d
996,30
57º percentil p
5780,10
79,0
Classe Modal
mp
Tags