Organização de dados estatísticos e sua
representação gráfica.
Relembra:
População ou universo estatístico é o conjunto de todos os
elementos com uma determinada característica, no qual se vai
realizar o estudo estatístico.
Amostra é um subconjunto da população, utilizada sempre que
não é possível estudar exaustivamente todos os elementos da
população.
Organizar os dados é transformar os “dados em bruto” num
resumo ordenadoque facilita a leitura e compreensão da
situação em estudo, através de tabelas ou gráficos.
Tabelas de frequências servem para organizar os dados.
Frequência absoluta é o número de vezes que o mesmo valor da
variável se repete.
Frequência reletiva é a razão entre a frequência absoluta e o
número total de observações.
Os dados estatísticos (variáveis estatísticas) podem ser
qualitativos ou quatitativos:
Qualitativos são os que não se podem expressar por um
número.Ex.: cor de olhos, estado civil...
Quantitativos são os que se podem expressar por um
número.Ex.: peso, altura,idades...Estes ainda podem ser:
Dados discretos se a variável só pode tomar valores
numéricos isolados. Ex.:número de filhos,nº de golos...
Dados contínuos se a variável pode tomar todos valores
numéricos, inteiros ou não, Compreendidos no seu intervalo de
variação.Neste caso os dados organizam-se em classes.
Ex.:peso ou altura de uma pessoa.
Representação gráfica de dados
estatísticos:
Na estatística recolhe-se, organiza-se e analisa-se informação
para depois tirar conclusões.
Os dados são normalmente apresentados em gráficos, pois
tornam-se mais fácil interpretá-los.
Os pictogramas são gráficos que utilizam figuras alusivas ao
fenómeno que vai ser estudado.
Como construir um pictograma?
1. Escolhe-se um símbolo alusivo ao fenémeno em estudo e
atribui-se um certo valor;
2. Representa-se graficamente a informação, por repetição
desse símbolo em linhas ou colunas, igualmente espaçadas;
3. Indica-se o significado de cada símbolo junto ao gráfico;
4. Dá-se um título ao gráfico;
Os gráficos de barras utilizam-se para representar dados
não agrupados, para variáveis estatísticas, discretas ou
qualitativas. Para cada valor da variável estatística traçam-se
barras, cujo comprimento é proporcional à frequência
(absoluta ou relativa) correspondente.
As barras têm sempre a mesma largura e devem estar separadas
por espaços iguais. O gráfico deve ter um título.
Os gráficos circulares ou sectogramas utilizam-se para
representar dados em percentagem relacionando-os uns com
os outros, como parte de um todo.A representação faz-se por
meio de um círculo dividido em sectores circulares, e para isso
determina-se a amplitude dos ângulos correspondentes a cada
percentagem (freq. Relativa x360º). O gráfico deve ter um
título.
Os histogramas são gráficos adequados para representar
dados quantitativos agrupados em classes. São gráficos de
barras formados por um conjunto de rectângulos adjacentes,
tendo cada rectângulo por base um intervalo de classe e por
altura a frequência correspondente.
Cada classe é definida por um extremo inferior e por um
extermo superior. A diferença dos dois extremos é a amplitude
da classe. O gráfico deve ter um título.
Os polígonos de frequências obtêm-se a partir de um
histograma, unindo por uma linha poligonal, os pontos médios
dos lados sauperiores dos rectângulos desse histograma.
A cada um desses pontos médios dá-se o nome de marca da
classe, valor central ou valor médio da classe. A marca da
classe calcula-se determinando a médio aritmética dos
extremos da classe.
Medidas de tendência central:
Habitualmente os valores de um conjunto de dados estão
dispersos,pelo que é aconselhável verificar se os valores têm
tendência a concentrar-se em torno de um valor central ou
médio.As medidas estatísticas que nos dão uma indicação
deste valor designam-se por MEDIDAS DE TENDÊNCIA
CENTRAL: média,moda e mediana.
Média- para calcular a média (ou média aritmética) de
um conjunto de valores, somam-se todos os valores e
divide-se a soma pelo número de valores considerados.Só
se pode calcular quando os dados são numéricos.
Moda- num conjunto de dados é o valor mais frequente
(ou que se repete mais vezes). Tanto se pode determinar
no caso dos dados serem numéricos como não sendo
numéricos. Se os dados estiverem agrupados em classes
diz-se classe modal. Se não tem moda diz-se amodal e se
houver duas modas diz-se bimodal.
Mediana- escrevem-se os dados por ordem crescente ou
decrescente. Se o número de dados é impar, a mediana é
o valor que ocupa a posição central. Se o número de
dados é par, a mediana é a média aritmética dos dois
valores centrais.