Tema 2. Organización y resumen de datospptx

SergioVillaverdeBarr 15 views 53 slides Sep 23, 2025
Slide 1
Slide 1 of 53
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10
Slide 11
11
Slide 12
12
Slide 13
13
Slide 14
14
Slide 15
15
Slide 16
16
Slide 17
17
Slide 18
18
Slide 19
19
Slide 20
20
Slide 21
21
Slide 22
22
Slide 23
23
Slide 24
24
Slide 25
25
Slide 26
26
Slide 27
27
Slide 28
28
Slide 29
29
Slide 30
30
Slide 31
31
Slide 32
32
Slide 33
33
Slide 34
34
Slide 35
35
Slide 36
36
Slide 37
37
Slide 38
38
Slide 39
39
Slide 40
40
Slide 41
41
Slide 42
42
Slide 43
43
Slide 44
44
Slide 45
45
Slide 46
46
Slide 47
47
Slide 48
48
Slide 49
49
Slide 50
50
Slide 51
51
Slide 52
52
Slide 53
53

About This Presentation

Tema 2. Organización y resumen de datos


Slide Content

TEMA 2. Organización y resumen de datos Sergio Villaverde Barroso

¿Qué vamos a ver en este tema? Objetivos de la Estadística Descriptiva. Conceptos básicos. Métodos para la organización de conjuntos de datos. Métodos para la representación gráfica de conjuntos de datos. Métodos para el resumen de conjuntos de datos.

Objetivos de la Estadística Descriptiva

2. Conceptos básicos Experimentos estadísticos : UNA VEZ SELECCIONADA la muestra de la población, medimos en las n unidades experimentales la variable o variables que queremos estudiar. Ejemplo : supongamos que X es una variable de la que obtendremos que x1, x2,…. Xn, son los DIFERENTES valores que toma la variable X en los individuos 1, 2,…. n. Se denomina muestra de la variable X .

3. Métodos para la organización de conjuntos de datos

¿Qué tipos de frecuencias existen? Frecuencia absoluta. Frecuencia absoluta acumulada. Frecuencia relativa. Frecuencia relativa acumulada.

Frecuencia absoluta (fi) Número de veces que se REPITE un dato. Se representa como fi . Se obtiene SUMANDO todas las veces que se repite cierta cantidad.

B. Frecuencia absoluta acumulada (Fi) SUMA de todas las frecuencias absolutas anteriores a la que queremos calcular. Se representa como Fi . La ÚLTIMA frecuencia absoluta acumulada es IGUAL al número total de datos (N).

C. Frecuencia relativa (ni) Es el COCIENTE entre la frecuencia absoluta de un determinado valor y el número total de datos. Se representa como ni . La suma de todas las frecuencias relativas tiene que ser IGUAL a 1 o al 100%.

D. Frecuencia relativa acumulada (Ni) Es el COCIENTE entre la frecuencia acumulada de un determinado valor y el número total de datos. Se representa como Ni . La ÚLTIMA frecuencia relativa acumulada es IGUAL a 1 o al 100%.

Pero, ¿cómo se construye una tabla de frecuencias? Datos simples

Xi Recuento fi Fi ni Ni Datos Frecuencia absoluta Frecuencia absoluta acumulada Frecuencia relativa Frecuencia relativa acumulada

Ejemplo con datos simples Durante el mes de agosto, en la ciudad de Madrid, se han registrado las siguientes temperaturas: 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 30, 31, 34, 33, 33, 29, 29 Xi Recuento fi Fi ni Ni 27 I 1 1 0,032 0,032 28 II 2 3 0,065 0,097 29 III III 6 9 0,194 0,290 30 III III I 7 16 0,226 0,516 31 III III II 8 24 0,258 0,774 32 III 3 27 0,097 0,871 33 III 3 30 0,097 0,968 34 I 1 31 0,032 1 TOTAL 31 1 1/31 = 0,032

Datos agrupados

Intervalos Ci fi Fi ni Ni Marca de clase o punto medio del intervalo Frecuencia absoluta Frecuencia absoluta acumulada Frecuencia relativa Frecuencia relativa acumulada

Ejemplo con datos agrupados En un centro comercial, se consultó la edad a todas las personas que entraban entre las 12:00 h y las 12:30 h. Los resultados obtenidos fueron los siguientes: 3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13 Intervalos Ci fi Fi ni Ni [0,5) 2,5 1 1 0,025 0,025 [5,10) 7,5 1 2 0,025 0,050 [10,15) 12,5 3 5 0,075 0,125 [15,20) 17,5 3 8 0,075 0,200 [20,25) 22,5 3 11 0,075 0,275 [25,30) 27,5 6 17 0,150 0,425 [30,35) 32,5 7 24 0,175 0,600 [35,40) 37,5 10 34 0,250 0,850 [40,45) 42,5 4 38 0,100 0,950 [45,50) 47,5 2 40 0,050 1 N = 40 1

4. Métodos para la representación gráfica de conjuntos de datos

Métodos para la representación gráfica de conjuntos de datos Métodos para la representación gráfica de conjuntos de datos Variables CUALITATIVAS Diagrama de sectores Diagrama de barras Variables CUANTITATIVAS Discretas Polígono de frecuencias Continuas Histograma

Variables cualitativas

A.1) Variables cualitativas: diagrama de sectores Se calculan las frecuencias relativas (ni). A la modalidad (Mi) se le asigna un ángulo de 360º. NO es conveniente que haya un número excesivo de modalidades.

A.2) Variables cualitativas: diagrama de barras Esta representación consiste en construir tantos RECTÁNGULOS O BARRAS como modalidades haya. La altura de cada barra puede ser igual a la frecuencia absoluta o a la frecuencia relativa de la modalidad a la que corresponde dicha barra.

B. Variables cuantitativas

B.1) Variables cuantitativas discretas: polígonos de frecuencias En el eje horizontal , se colocan los valores ordenados de MENOR a MAYOR. A cada valor, se le asocia un punto con la altura correspondiente a su frecuencia absoluta. Los puntos se UNEN mediante líneas.

5. Métodos para el resumen de conjuntos de datos

¿Qué son las medidas de posición? Después de reunir todos los datos, es necesario calcular un número ÚNICO que represente TODOS los datos. Las medidas de posición forman parte del conjunto de medidas descriptivas numéricas clasificadas como “parámetros” (calculadas a partir de la población TOTAL) o “estadísticos” (calculadas a partir de los datos de una MUESTRA). Una medida de posición es un número que se toma como ORIENTACIÓN para referirnos a un conjunto de datos.

Medidas de posición central: media aritmética, moda y mediana

a.1) Media aritmética Se trata del valor MEDIO de todos los valores que toma la variable estadística de una serie de datos. Es el COCIENTE de dividir la sumatoria de todos los valores que toma la variable entre el número total de datos.

a.1) Media aritmética

Datos SIMPLES Las notas de una clase de 2º carrera de Geografía han sido las siguientes: 7, 4, 5, 2, 8, 8, 6, 5, 4, 6, 7, 8, 6, 3, 2, 9, 7, 6, 10, 5, 4. Calcular la media de esa clase Escribimos la fórmula 2. Sustituimos los datos en la fórmula = 7 + 4 + 5 + 2 + 8 + 8 + 6 + 5 + 4 + 6 + 7 + 8 + 6 + 3 + 2 + 9 + 7 + 6 + 10 + 5 + 4 21 = 5,80 puntos

Datos AGRUPADOS

Datos AGRUPADOS Un grupo de 360 obreros se encuentra entre los siguientes pesos: Calcular el peso medio de los obreros = (77,5·2 · 20) + (82,5 · 40) + (87,5 · 60) + (92,5 · 100) + ( 97,5 ·140) 360 = 91,67 unidades ¡¡¡OJO con el redondeo!!!

a.2) Moda Indica la magnitud del valor que se presenta con MÁS frecuencia en una serie de datos. Se representa como Mo . En algunas distribuciones de frecuencias (simples o agrupadas), pueden existir DOS O MÁS modas

Datos SIMPLES Datos: 32, 31, 28, 29, 33, 32, 31, 30, 31, 31. Como se puede observar en la tabla , el dato que más se repite es el 31. Por lo tanto, la moda es el 31. Xi fi 28 1 29 1 30 1 31 4 32 2 33 1

Datos AGRUPADOS

Datos AGRUPADOS Dada la siguiente distribución de las precipitaciones en mm. de una ciudad A durante varios meses, calcule la moda. Intervalo fi [30 – 40) 2 ]40 – 50) 2 [50 – 60) 7 [60 – 70) 11 [80 – 90) 12 [90 – 100) 16 2 Clase modal —>

a.3) Mediana Valor que divide en 2 partes IGUALES la distribución de datos, de tal forma que el número de datos por encima de la mediana sea IGUAL al número de datos por debajo de la mediana. La mediana ocupa el lugar central de todos los datos ORDENADOS de menor a mayor o viceversa. Se representa como Me . SÓLO puede calcularse con variables cuantitativas .

Datos simples

Datos simples

Datos agrupados Elaborar la tabla de frecuencias con sus marcas de clase , frecuencias absolutas (fi) y frecuencias absolutas acumuladas (Fi). Determinar la POSICIÓN de la mediana en el intervalo de la distribución de frecuencias mediante la fórmula Aplicar la siguiente fórmula : n 2 Li : límite inferior de la clase modal. n : número total de datos. F(i – 1) : frecuencia absoluta acumulada ANTERIOR a la clase modal. fi : frecuencia absoluta de clase donde se encuentra la mediana. Ic : amplitud del intervalo.

Datos agrupados

Medidas de posición NO central: CUARTILES, DECILES Y PERCENTILES

Cuartiles

Deciles

Centiles o percentiles

Ejemplo cálculo deciles

Medidas de dispersión: rango, varianza, desviación típica y coeficiente de variación

a) Rango Se define como la DIFERENCIA entre el cuartil 3 (Q3) y el cuartil 1 (Q1) de una distribución de frecuencias Rango (R) = Q3 – Q1

b) Varianza Mide la VARIABILIDAD de los datos respecto de la media

c) Desviación típica Se define como la raíz cuadrada de la varianza .

d) Coeficiente de variación Expresa el tamaño de la desviación típica por unidad de media elegida. Es un coeficiente adimensional . También, puede expresarse en porcentaje. Si CV > 1, la media no es representativa.

¡¡¡FIN!!!
Tags