ESTADISTICA aplicada con datos agrupados - mètodo de sturges

frebar2020 0 views 11 slides Sep 22, 2025
Slide 1
Slide 1 of 11
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10
Slide 11
11

About This Presentation

estadìstica


Slide Content

Qué son los datos agrupados?
En estadística, los datos agrupados son aquellos datos que se agrupan en intervalos. Es decir, los datos
agrupados son datos que se juntan en intervalos para poder estudiarlos de manera conjunta.
Así pues, al agrupar un conjunto de datos estadísticos se separan en diferentes intervalos, de manera que
cada dato solo puede pertenecer a un único intervalo.
En definitiva, en estadística la agrupación de datos sirve para analizar conjuntamente varios datos, de
manera que los datos agrupados en un intervalo se tratan como un solo dato. Además, agrupar los datos
es muy útil cuando la muestra es muy grande.
.
:¿Cuál es la regla de Sturges?
.
De modo que debemos separar los datos y agruparlos en siete intervalos. Ahora necesitamos saber la
amplitud (a) de cada intervalo, para ello, simplemente tenemos que dividir el valor máximo menos el
valor mínimo entre el número total de intervalos:
(Para determinar el NUMERO DE INTERVALOS, también se puede calcular con: √N + 1
INTERVALO
( Li - Ls )
MARCA
DE CLASE
(Xi )
(Li+Ls)/2
FREC.
ABSOLUTA
fI
FREC.
ABSOLUTA
ACUM.
FI
FRECUENCIA
RELATIVA
(hI )= fI / N
FREC.
RELATIVA
ACUM.
Hi
FREC.
RELATIVA
PORCEN.
100hI
FREC.
RELATIVA
PORC.
100Hi
Qué son los datos agrupados?
En estadística, los datos agrupados son aquellos datos que se agrupan en intervalos. Es decir, los datos
agrupados son datos que se juntan en intervalos para poder estudiarlos de manera conjunta.
Así pues, al agrupar un conjunto de datos estadísticos se separan en diferentes intervalos, de manera que
cada dato solo puede pertenecer a un único intervalo.
En definitiva, en estadística la agrupación de datos sirve para analizar conjuntamente varios datos, de
manera que los datos agrupados en un intervalo se tratan como un solo dato. Además, agrupar los datos
es muy útil cuando la muestra es muy grande.
.
:¿Cuál es la regla de Sturges?
.
De modo que debemos separar los datos y agruparlos en siete intervalos. Ahora necesitamos saber la
amplitud (a) de cada intervalo, para ello, simplemente tenemos que dividir el valor máximo menos el
valor mínimo entre el número total de intervalos:
(Para determinar el NUMERO DE INTERVALOS, también se puede calcular con: √N + 1
INTERVALO
( Li - Ls )
MARCA
DE CLASE
(Xi )
(Li+Ls)/2
FREC.
ABSOLUTA
fI
FREC.
ABSOLUTA
ACUM.
FI
FRECUENCIA
RELATIVA
(hI )= fI / N
FREC.
RELATIVA
ACUM.
Hi
FREC.
RELATIVA
PORCEN.
100hI
FREC.
RELATIVA
PORC.
100Hi
Ejemplo de datos agrupados:
Vista la definición de datos agrupados, a continuación se
muestra un ejemplo resuelto de cómo se agrupa un
conjunto de datos en diferentes intervalos
Se ha medido la estatura a una muestra de 50 personas
diferentes y se han registrado todos los valores en la
siguiente tabla de datos. Agrupa el conjunto de datos en
intervalos y luego representa los datos gráficamente.
En primer lugar, tenemos que separar los datos en
intervalos. Para ello hay muchos métodos, pero la regla
de Sturges es la más utilizada, ya que permite calcular el
número de intervalos idóneo ( c )
La regla de Sturges es una regla que sirve para
calcular el número de clases o intervalos
idóneo en los que se debe dividir un conjunto
de datos.
La mayoría de calculadoras solo permiten hacer
cálculos con logaritmos de base 10. En tal caso,
puedes utilizar esta fórmula equivalente:
Una vez hemos calculado los intervalos,
tenemos que contar el número de veces que
aparece un dato en cada intervalo y construir
la tabla de frecuencias:
Ejemplo de datos agrupados:
Vista la definición de datos agrupados, a continuación se
muestra un ejemplo resuelto de cómo se agrupa un
conjunto de datos en diferentes intervalos
Se ha medido la estatura a una muestra de 50 personas
diferentes y se han registrado todos los valores en la
siguiente tabla de datos. Agrupa el conjunto de datos en
intervalos y luego representa los datos gráficamente.
En primer lugar, tenemos que separar los datos en
intervalos. Para ello hay muchos métodos, pero la regla
de Sturges es la más utilizada, ya que permite calcular el
número de intervalos idóneo ( c )
La regla de Sturges es una regla que sirve para
calcular el número de clases o intervalos
idóneo en los que se debe dividir un conjunto
de datos.
La mayoría de calculadoras solo permiten hacer
cálculos con logaritmos de base 10. En tal caso,
puedes utilizar esta fórmula equivalente:
Una vez hemos calculado los intervalos,
tenemos que contar el número de veces que
aparece un dato en cada intervalo y construir
la tabla de frecuencias:

Completa la tabla de frecuencias Completa la tabla de frecuencias



Completa la tabla de frecuencias Completa la tabla de frecuencias



Completa la tabla de frecuencias Completa la tabla de frecuencias



Completa la tabla de frecuencias Completa la tabla de frecuencias

En los cuatro casos, elabora el cuadro de frecuencias (absoluta, relativa y porcentual)
Elabora la gràfica de barras, poligonal y circular.

En los cuatro casos, elabora el cuadro de frecuencias (absoluta, relativa y porcentual)
Elabora la gràfica de barras, poligonal y circular.

En los cuatro casos, elabora el cuadro de frecuencias (absoluta, relativa y porcentual)
Elabora la gràfica de barras, poligonal y circular.

En los cuatro casos, elabora el cuadro de frecuencias (absoluta, relativa y porcentual)
Elabora la gràfica de barras, poligonal y circular.

ESTADISTICA BASICA

TABLA O CUADRO DE DISTRIBUCION DE FRECUENCIAS ESTADISTICAS
VARIABL
E
XI
FREC.
ABSOLUTA
fI
FREC.
ABSOLUT
A ACUM.
FI
FRECUENCIA
RELATIVA
(hI )= fI / N
FREC.
RELATIVA
ACUM.
Hi
FREC.
RELATIVA
PORCEN.
100hI
FREC.
RELATIVA
ACUM
PORC.
100Hi
ESTADISTICA BASICA

TABLA O CUADRO DE DISTRIBUCION DE FRECUENCIAS ESTADISTICAS
VARIABL
E
XI
FREC.
ABSOLUTA
fI
FREC.
ABSOLUT
A ACUM.
FI
FRECUENCIA
RELATIVA
(hI )= fI / N
FREC.
RELATIVA
ACUM.
Hi
FREC.
RELATIVA
PORCEN.
100hI
FREC.
RELATIVA
ACUM
PORC.
100Hi

A continuación tenemos una serie de mediciones de velocidad en km/h, tomadas con radar,
que corresponden a 50 autos que pasaron por una calle de determinada ciudad:
Solución; Los datos así presentados no están organizados, así que el primer paso es agruparlos
en clases.
Pasos para agrupar los datos y construir la tabla
Paso 1: Hallar el rango R = (52 – 16) km/h = 36 km/h
Paso 2: Seleccionar el número de clases Nc, de acuerdo al criterio dado. Como hay 50 datos,
podemos escoger Nc = 6.
Paso 3: Calcular el ancho c del intervalo: c = Rango /Nc = 36 / 6 = 6
Paso 4: Formar clases y agrupar datos de la siguiente manera: para la primera clase se escoge
como límite inferior un valor apenas menor que el menor valor presente en la tabla, después se
le suma a este valor el de c=6, calculado previamente, y se obtiene así el límite superior de la
primera clase.
Se procede de la misma manera para construir el resto de las clases, como se muestra en la
siguiente tabla:
Cada frecuencia corresponde a un color en la figura 2, de esta forma se asegura que ningún
valor escape de ser contabilizado.
Cálculo de la media
X = (5 x 18.5 +25 x 25.0 + 10 x 31.5 + 6 x 38.0 + 2 x 44.5 + 2 x 51.0) ÷ 50 = 29.03 km/h
Cálculo de la mediana:
La mediana se encuentra en la clase 2 de la tabla, ya que allí están los 30 primeros datos de la
distribución.
-Ancho del intervalo al que pertenece la mediana: c=6
-Frontera inferior del intervalo donde está la mediana: BM = 22.0 km/h
-Número de observaciones que contiene el intervalo fm =25
-Total de datos dividido entre 2: 50/2 = 25
-Cantidad de observaciones que hay antes del intervalo que contiene la mediana: fBM = 5
Y la operación es:
Mediana = 22.0 + [(25-5)÷25]×6 = 26.80 km/h
Cálculo de la moda:
La moda también se encuentra en la clase 2:
-Ancho del intervalo: c = 6
-Límite inferior de la clase donde se encuentra la moda: L1 = 22.0
-Resta entre la frecuencia de la clase modal y la frecuencia de la clase que la precede:
Δ1 =25-5= 20
-Resta entre la frecuencia de la clase modal y la frecuencia de la clase que le sigue:
Δ2 = 25 – 10 = 15
Con estos datos la operación es: Moda = 22.0 + [20 ÷ (20+15)]x6 = 25.4 km/h
Medidas de tendencia central para datos agrupados: fórmulas
Media aritmética: La media es la más utilizada para caracterizar datos cuantitativos (valores
numéricos), aunque es bastante sensible a los valores extremos de la distribución. Se calcula
mediante:
Con:
-X: promedio o  media aritmética -fi: frecuencia de la clase
-mi: la marca de clase-g: número de clases-n: total de los datos
Mediana: Para calcularla es necesario hallar el intervalo que contiene la observación n/2 e
interpolar para determinar el valor numérico de dicha observación, mediante la siguiente
fórmula: Donde:
-c: ancho del intervalo al que pertenece la mediana -BM: frontera inferior de dicho intervalo
-fm: número de observaciones que contiene el intervalo -n/2: total de datos dividido entre 2.
-fBM: cantidad de observaciones que hay antes del intervalo que contiene la mediana.
Por lo tanto, la mediana es una medida de posición, es decir, divide el conjunto de datos en dos
partes.

Moda: En los datos agrupados, se busca la clase o categoría que contiene la mayoría de las
observaciones. Esta es la clase modal. Puede que una distribución tenga dos o más modas, en
cuyo caso se la denomina bimodal y multimodal, respectivamente.
También se puede calcular la moda en datos agrupados siguiendo la ecuación:
Con:
-L1: límite inferior de la clase donde se encuentra la moda
-Δ1: resta entre la frecuencia de la clase modal y la frecuencia de la clase que la precede.
-Δ2: resta entre la frecuencia de la clase modal y la frecuencia de la clase que le sigue.
-c: ancho del intervalo que contiene la moda
Medidas de tendencia central para datos agrupados: fórmulas
Media aritmética: La media es la más utilizada para caracterizar datos cuantitativos (valores
numéricos), aunque es bastante sensible a los valores extremos de la distribución. Se calcula
mediante:
Con:
X: promedio o  media aritmética fi: frecuencia de la clase
mi: la marca de claseg: número de clasesn: total de los datos
Mediana: Para calcularla es necesario hallar el intervalo que contiene la observación n/2 e
interpolar para determinar el valor numérico de dicha observación, mediante la siguiente
fórmula: Donde:
a: ancho del intervalo al que pertenece la mediana Linf: frontera inferior de dicho intervalo
fi: número de observaciones que contiene el intervalo n/2: total de datos dividido entre 2.
Fi - 1: cantidad de observaciones que hay antes del intervalo que contiene la mediana.
Por lo tanto, la mediana es una medida de posición, es decir, divide el conjunto de datos en dos
partes.
Moda: En los datos agrupados, se busca la clase o categoría que contiene la mayoría de las
observaciones. Esta es la clase modal. Puede que una distribución tenga dos o más modas, en
cuyo caso se la denomina bimodal y multimodal, respectivamente.
También se puede calcular la moda en datos agrupados siguiendo la ecuación:
Con:
L1: límite inferior de la clase donde se encuentra la moda
Δ1: resta entre la frecuencia de la clase modal y la frecuencia de la clase que la precede.
Δ2: resta entre la frecuencia de la clase modal y la frecuencia de la clase que le sigue.
a: ancho o amplitud del intervalo que contiene la moda
A continuación tenemos una serie de mediciones de velocidad en km/h, tomadas con radar,
que corresponden a 50 autos que pasaron por una calle de determinada ciudad:
Medidas de tendencia central para datos agrupados: fórmulas
Media aritmética: La media es la más utilizada para caracterizar datos cuantitativos (valores
numéricos), aunque es bastante sensible a los valores extremos de la distribución. Se calcula
mediante:
Con:
X: promedio o  media aritmética fi: frecuencia de la clase
mi: la marca de claseg: número de clasesn: total de los datos
Mediana: Para calcularla es necesario hallar el intervalo que contiene la observación n/2 e
interpolar para determinar el valor numérico de dicha observación, mediante la siguiente
fórmula: Donde:
a: ancho del intervalo al que pertenece la mediana Linf: frontera inferior de dicho intervalo
fi: número de observaciones que contiene el intervalo n/2: total de datos dividido entre 2.
Fi - 1: cantidad de observaciones que hay antes del intervalo que contiene la mediana.
Por lo tanto, la mediana es una medida de posición, es decir, divide el conjunto de datos en dos
partes.
Moda: En los datos agrupados, se busca la clase o categoría que contiene la mayoría de las
observaciones. Esta es la clase modal. Puede que una distribución tenga dos o más modas, en
cuyo caso se la denomina bimodal y multimodal, respectivamente.
También se puede calcular la moda en datos agrupados siguiendo la ecuación:
Con:
L1: límite inferior de la clase donde se encuentra la moda
Δ1: resta entre la frecuencia de la clase modal y la frecuencia de la clase que la precede.
Δ2: resta entre la frecuencia de la clase modal y la frecuencia de la clase que le sigue.

a: ancho del intervalo que contiene la moda
A continuación tenemos una serie de mediciones de velocidad en km/h, tomadas con radar,
que corresponden a 50 autos que pasaron por una calle de determinada ciudad:
Con los datos obtenidos (puntaje obtenido en una prueba). Construye la TABLA DE
FRECUENCIAS para datos sueltos, defina la variable, tipo de variable, moda, mediana ,
promedio y elabora su gráfica histograma-poligonal
Con los datos obtenidos al consultar la edad de los alumnos que que asistieron a un curso.
Construye la TABLA DE FRECUENCIAS para datos sueltos, defina la variable, tipo de variable,
moda, mediana , promedio y elabora su gráfica histograma-poligonal
Sea el rendimiento (en kilómetros por litro de gasolina) de 120 vehículos controlados por una
compañía. Construye la TABLA DE FRECUENCIAS para datos sueltos, defina la variable, tipo de
variable, moda, mediana , promedio y elabora su gráfica histograma-poligonal.
Con los datos obtenidos (puntaje obtenido en una prueba). Construye la TABLA DE
FRECUENCIAS para datos sueltos, defina la variable, tipo de variable, moda, mediana ,
promedio y elabora su gráfica histograma-poligonal
Con los datos obtenidos al consultar la edad de los alumnos que que asistieron a un curso.
Construye la TABLA DE FRECUENCIAS para datos sueltos, defina la variable, tipo de variable,
moda, mediana , promedio y elabora su gráfica histograma-poligonal
Sea el rendimiento (en kilómetros por litro de gasolina) de 120 vehículos controlados por una
compañía. Construye la TABLA DE FRECUENCIAS para datos sueltos, defina la variable, tipo de
variable, moda, mediana , promedio y elabora su gráfica histograma-poligonal.

Con los datos obtenidos (número de hijos por cada familia en un conjunto habitacional).
Construye la TABLA DE FRECUENCIAS para datos sueltos, defina la variable, tipo de variable,
moda, mediana , promedio y elabora su gráfica histograma-poligonal
Con los datos obtenidos (edad de pacientes en una clínica pediátrica). Construye la TABLA DE
FRECUENCIAS para datos sueltos, defina la variable, tipo de variable, moda, mediana ,
promedio y elabora su gráfica histograma-poligonal
Con los datos obtenidos de un grupo de alumnos (color favorito). Construye la TABLA DE
FRECUENCIAS para datos sueltos, defina la variable, tipo de variable, moda, mediana ,
promedio y elabora su gráfica histograma-poligonal
Con los datos obtenidos (número de hijos por cada familia en un conjunto habitacional).
Construye la TABLA DE FRECUENCIAS para datos sueltos, defina la variable, tipo de variable,
moda, mediana , promedio y elabora su gráfica histograma-poligonal
Con los datos obtenidos (edad de pacientes en una clínica pediátrica). Construye la TABLA DE
FRECUENCIAS para datos sueltos, defina la variable, tipo de variable, moda, mediana ,
promedio y elabora su gráfica histograma-poligonal

Con los datos obtenidos de un grupo de alumnos (color favorito). Construye la TABLA DE
FRECUENCIAS para datos sueltos, defina la variable, tipo de variable, moda, mediana ,
promedio y elabora su gráfica histograma-poligonal
Tags