UNIDAD 01 Estadística Descriptiva (introducción )

antoniocardenas62 18 views 109 slides Sep 09, 2025
Slide 1
Slide 1 of 109
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10
Slide 11
11
Slide 12
12
Slide 13
13
Slide 14
14
Slide 15
15
Slide 16
16
Slide 17
17
Slide 18
18
Slide 19
19
Slide 20
20
Slide 21
21
Slide 22
22
Slide 23
23
Slide 24
24
Slide 25
25
Slide 26
26
Slide 27
27
Slide 28
28
Slide 29
29
Slide 30
30
Slide 31
31
Slide 32
32
Slide 33
33
Slide 34
34
Slide 35
35
Slide 36
36
Slide 37
37
Slide 38
38
Slide 39
39
Slide 40
40
Slide 41
41
Slide 42
42
Slide 43
43
Slide 44
44
Slide 45
45
Slide 46
46
Slide 47
47
Slide 48
48
Slide 49
49
Slide 50
50
Slide 51
51
Slide 52
52
Slide 53
53
Slide 54
54
Slide 55
55
Slide 56
56
Slide 57
57
Slide 58
58
Slide 59
59
Slide 60
60
Slide 61
61
Slide 62
62
Slide 63
63
Slide 64
64
Slide 65
65
Slide 66
66
Slide 67
67
Slide 68
68
Slide 69
69
Slide 70
70
Slide 71
71
Slide 72
72
Slide 73
73
Slide 74
74
Slide 75
75
Slide 76
76
Slide 77
77
Slide 78
78
Slide 79
79
Slide 80
80
Slide 81
81
Slide 82
82
Slide 83
83
Slide 84
84
Slide 85
85
Slide 86
86
Slide 87
87
Slide 88
88
Slide 89
89
Slide 90
90
Slide 91
91
Slide 92
92
Slide 93
93
Slide 94
94
Slide 95
95
Slide 96
96
Slide 97
97
Slide 98
98
Slide 99
99
Slide 100
100
Slide 101
101
Slide 102
102
Slide 103
103
Slide 104
104
Slide 105
105
Slide 106
106
Slide 107
107
Slide 108
108
Slide 109
109

About This Presentation

Presentación de introducción a la unidad de estadística descriptiva en la materia de probabilidad y estadística.


Slide Content

Unidad I.- Estadística Descriptiva Presenta: Antonio de Jesús Cárdenas Hernández [email protected] Probabilidad y Estadística

Objetivo de la unidad de aprendizaje. El alumno realizará el procesamiento de datos para contribuir a la toma de decisiones. Probabilidad y Estadística

Temas de la unidad I.1 Introducción a la estadística I.2 Población, muestra y muestreo I.3 Distribución de frecuencias y su representación gráfica I.4 Medidas de tendencia central, localización y dispersión

I.1Introducción a la estadística

Estadística “Estudio de los métodos de recogida y descripción de datos, así como del análisis de esta información” Probabilidad y Estadística

Estadística descriptiva La estadística descriptiva, como indica su nombre, tiene por finalidad describir. Edad Sexo Integrantes de una familia Etcétera. Probabilidad y Estadística

Estadística Inferencial. La estadística inferencial es necesaria cuando queremos hacer alguna afirmación sobre más elementos de los que vamos a medir. La estadística inferencial hace que ese salto de la parte al todo se haga de una manera “controlada”. Probabilidad y Estadística

Aplicaciones La estadística descriptiva, como indica su nombre, tiene por finalidad describir. Así, si queremos estudiar diferentes aspectos de, por ejemplo, un grupo de personas, la estadística descriptiva nos puede ayudar. Probabilidad y Estadística

Aplicaciones En el ámbito científico, la estadística, en general, y la estadística inferencial, en particular, es el camino que hay que recorrer para llegar de una pregunta a la respuesta adecuada. Así, la estadística no es más que un argumento para defender nuestras ideas. Probabilidad y Estadística

Estadística Descriptiva Probabilidad y Estadística

La estadística descriptiva es la rama de las Matemáticas que recolecta, presenta y caracteriza un conjunto de datos con el fin de describir apropiadamente las diversas características de ese conjunto. Probabilidad y Estadística

Variable estadística Al conjunto de los distintos valores numéricos que adopta un carácter cuantitativo se llama variable estadística . Probabilidad y Estadística

Probabilidad y Estadística

Conceptos de comportamiento: Individuo: cualquier elemento que porte información sobre el fenómeno que se estudia. Así, si estudiamos la altura de los niños de una clase, cada alumno es un individuo; si se estudia el precio de la vivienda, cada vivienda es un individuo. Probabilidad y Estadística

Conceptos de comportamiento: Población : Es una colección finita o infinita de elementos con características comunes. Algunas poblaciones son finitas y pueden conocerse; otras pueden ser infinitas y abstractas. Probabilidad y Estadística

Conceptos de comportamiento: Muestra: subconjunto que seleccionado de una población. Se denota por n. Probabilidad y Estadística

Dato Cada valor observado de la variable. Si representamos por X a la variable, representaremos por x i cada dato diferente observado en la muestra, el subíndice “i” indica el lugar que ocupa si los ordenamos de menor a mayor. Probabilidad y Estadística

Medición Una medición se puede definir como la manera de obtener símbolos para representar propiedades de personas, objetos, eventos o estados cuyos símbolos tienen la misma relación relevante entre si igual a las entidades que representan. Probabilidad y Estadística

Probabilidad y Estadística

Escala de medición Nominal Consiste en clasificar a los elementos, personas, animales, etc , asignándoles símbolos o nombres. Los datos que se obtienen para una variable cualitativa se miden en una escala nominal y simplemente se clasifican en distintas categorías que no implican orden. Probabilidad y Estadística

Escala de medición Nominal La escala nominal es la forma más débil de medición porque no se puede aplicar operaciones aritméticas ni intentar el conteo de las diferencias dentro de una categoría determinada o especificar cualquier orden o dirección a lo largo de las diversas categorías. Probabilidad y Estadística

Propiedades de la Escala Nominal No intervienen mediciones, ni escala, en vez de esto solo hay cuentas o conteos. No existe un orden específico para esta categoría. No presentan el cero. No se basa en diferencia cuantitativa. Probabilidad y Estadística

El tipo de operación estadística más utilizada en la escala nominal es el conteo de las frecuencias (distribuciones de frecuencias), con que se presentan las características en las unidades de las respectivas subclases. Probabilidad y Estadística

Estas frecuencias pueden ser presentadas con números absolutos, porcentajes y proporciones. Además, puede calcularse la moda, razones, tasas de incremento, y el coeficiente de contingencia. Tipos de gráficos: Diagrama de Barras. Probabilidad y Estadística

Ejemplos Una muestra de personas puede clasificarse con base en la religión profesada: (1) Cristianos; (2) Judíos; (3) Musulmanes; (4) Otros; y (5) Sin Creencia alguna. O bien podrían clasificarse según el sexo, el color de los ojos, algún partido político, etcétera. Probabilidad y Estadística

Ejemplos: Otros ejemplos de escala nominal puede ser el numero de placa de los vehículos, los números de los teléfonos de una ciudad, la Cedula de Identidad de los habitantes de un país, etcétera. Probabilidad y Estadística

Escala de medición Ordinal: Establece una relación de orden entre los elementos (personas, animales, objetos, etc.), en atención a una característica, sin que reflejen distancia entre ellos. Probabilidad y Estadística

Escala de medición Ordinal: La diferencia entre dos números ordinales no tiene significado cuantitativo, sólo expresan, por ejemplo, que una situación es mejor que otra, pero no dice cuanto es uno que el otro. Probabilidad y Estadística

Escala de medición Ordinal: La diferencia fundamental entre una escala nominal y una ordinal es que en la ordinal rige no sólo la relación de igualdad, de identidad, sino también la relación de “mayor que”. Probabilidad y Estadística

Propiedades de la escala nominal Las observaciones o elementos se les ordena en rangos o categorías diferentes. Las categorías son mayores o menores que otras categorías, es decir, que existe una clasificación de mayor a menor (jerarquía). Las categorías son mutuamente excluyentes y exhaustivas. No presentan el cero. Probabilidad y Estadística

Ejemplo: Calificaciones de Estudiantes Calificaciones N° de calificaciones Excelente 3 Sobresaliente 6 Distinguido 10 Bueno 38 Satisfactorio 25 Deficiente 50 Muy Deficiente Probabilidad y Estadística

Escala de Medición de Intervalos Esta escala se caracteriza por tener una unidad de medida y un origen (cero) arbitrario. La escala de intervalos a diferencia de la nominal y ordinal, es una escala efectivamente cuantitativamente. Probabilidad y Estadística

Escala de Medición de Intervalos La razón entre dos intervalos es siempre independiente del punto cero y de la unidad que se emplee en la medición. En el caso de las escalas de intervalos las unidades de medición son iguales. Probabilidad y Estadística

Las estadísticas apropiadas para esta escala son: media, desviación estándar, rango, varianza, coeficiente de variación, asimetría y kurtosis . Tipos de gráficos: histograma, polígono de frecuencias y gráfico de tallos y hojas. Probabilidad y Estadística

Propiedades de la escala de intervalo Esta escala implica la cuantificación de los datos. En estás medidas se utilizan unidades constantes de medición (capacidad, peso, Céntimos, grados Fahrenheit o centígrados) los cuales producen intervalos iguales entre puntos de la escala. Proporcionan números que manifiestan diferencias palpables entre individuos, objetos o cosas. En esta escala de intervalos el punto cero (0) y la unidad de medida es arbitrario. Se pueden aplicar todas las medidas estadísticas más conocidas, con excepción del coeficiente de variación. Son mutuamente exclusivas y exhaustivas. Probabilidad y Estadística

Ejemplo: Calificación de una prueba de Estadística realizada en la UCV Puntuación N° de Estudiantes 90-99 2 80-89 6 70-79 15 60-69 30 Menos de 60 60 Probabilidad y Estadística

Escala de Medición de Razón o Proporción Esta constituye el nivel más alto de medición, posee todas las características de las escalas nominales, ordinales y de intervalos; además tiene un cero absoluto o natural que tiene significado físico. Probabilidad y Estadística

Escala de Medición de Razón o Proporción Cuando se emplea este tipo de escala, los números indican razones o cocientes entre ciertas magnitudes de los objetos, y los datos obtenidos con tales escalas pueden ser sometidos a los tratamientos más elaborados. Probabilidad y Estadística

Propiedades de la escala a razón: La distancia entre los números es un tamaño conocido y constante. Los datos tienen un punto cero significativo. Puede utilizarse cualquier prueba de tipo estadístico, incluyendo el coeficiente de variación . Permite hacer comparaciones entre los números verdaderos con un cero aritmético siendo arbitrario únicamente la unidad de medida. Probabilidad y Estadística

Ejemplo: Computadoras vendidas Meses N° de computadores Octubre 4,000 Noviembre 6,000 Diciembre 15,000 Probabilidad y Estadística

Distribución de frecuencias y su representación gráfica Probabilidad y Estadística

Distribución de frecuencias La distribución de frecuencia es una disposición tabular de datos estadísticos, ordenados ascendente o descendentemente, de acuerdo a la frecuencia de cada dato. Probabilidad y Estadística

Su forma mas común es la siguiente: Probabilidad y Estadística

Frecuencia absoluta ( ):   Es el número de veces que se repite un determinado valor de la variable ( ). Se designa por . PROPIEDAD : la suma de todas las frecuencias absolutas es igual al total de observaciones (n).   Probabilidad y Estadística

Frecuencia acumulada ( )   Las frecuencias acumuladas de una distribución de frecuencias son aquellas que se obtienen de las sumas sucesivas de las fi que integran cada una de las filas de una distribución de frecuencia, esto se logra cuando la acumulación de las frecuencias se realiza tomando en cuenta la primera fila hasta alcanzar la ultima. Probabilidad y Estadística

Frecuencia acumulada ( )   Las frecuencias acumuladas se designan con las letras F i . Se calcula: PROPIEDAD: La última frecuencia acumulada absoluta es igual al total de observaciones. Probabilidad y Estadística

Frecuencia relativa ( )   Es aquella que resulta de dividir cada una de las frecuencias absolutas entre el número total de datos. Las frecuencias relativas se designan con las letras . Se calcula, PROPIEDAD: la suma de todas las frecuencias relativas es igual a la unidad.   Probabilidad y Estadística

Frecuencia relativa acumulada ( )   Es aquella que resulta de dividir cada una de las frecuencias acumuladas entre número total de datos. Se designa con las letras . Se calcula; PROPIEDAD: La última frecuencia relativa acumulada es la unidad.   Probabilidad y Estadística

Ejemplo 1: El gobierno desea averiguar si el número medio de hijos por familia ha descendido respecto de la década anterior. Para ello ha encuestado a 50 familias respecto al número de hijos, y ha obtenido los siguientes datos: Probabilidad y Estadística

Realice: Construir una tabla de frecuencias absolutas ¿Cuál es el número de familias que tiene como máximo dos hijos? ¿Cuántas familias tienen mas de un hijo pero máximo tres ? ¿Qué porcentaje de familias tiene más de tres hijos? Probabilidad y Estadística

Tipos de gráficos Diferentes conjuntos de datos son particularmente aptos para ciertos tipos de gráficos. A continuación hay una vista general de los tipos de gráficos principales y sus usos más comunes.

Barra El gráfico de Barras (también conocido como gráfico de Columnas) es una herramienta excelente para presentar o comparar varios conjuntos de datos.

GRÁFICO LINEAL Este gráfico presenta sus datos como una serie de puntos conectados por una línea. El gráfico de línea se usa mejor con los datos de un gran número de grupos

Gráfico circular Un gráfico circular muestra los datos como un círculo dividido en secciones de colores o diseños. Este tipo de gráfico se usa solamente con un grupo de datos (por ejemplo, el porcentaje de las ventas para el inventario completo)

Gráfico de anillos El gráfico de Anillo es similar al gráfico circular y muestra los datos como secciones de un círculo o anillo. Si, por ejemplo, usted ha graficado las ventas por región en un informe, vería el número total de ventas en el centro del anillo, y vería las regiones como secciones del anillo en colores. Como con el gráfico circular, tiene la opción de elegir múltiples gráficos de anillo para múltiples grupos de datos

Gráfico de burbujas El gráfico de Burbujas presenta los datos como una serie de burbujas, donde el tamaño de las burbujas está en proporción a la cantidad de datos. Un gráfico de este tipo sería muy efectivo para mostrar el número de productos vendidos en cierta región.

Histograma Es la gráfica de la tabla de distribución de frecuencias para datos agrupados, consiste de barras cuyas bases son los intervalos de clases y cuyas alturas son proporcionales a las frecuencias absolutas (o relativas) de los correspondientes intervalos. Un histograma permite ver la forma de la distribución de los datos, en particular, se puede ver si hay simetría con respecto al centro de la distribución.

POLÍGONO DE FRECUENCIA Un polígono de frecuencias es la gráfica que se obtiene al unir en forma consecutiva con segmentos los puntos de intersección entre los puntos medios de cada clase y su frecuencia, incluyendo el punto medio anterior a la primera clase y el punto medio posterior a la última clase.

Pictograma Es un gráfico con dibujos alusivos al carácter que se está estudiando y cuyo tamaño es proporcional a la frecuencia que representan.

Gráficos de áreas Los gráficos de áreas son muy parecidos a los gráficos de líneas, aunque muestran colores distintos en las áreas situadas debajo de las líneas. Este diseño multicolor y visual permite distinguir los datos con más claridad.

I.2 MUESTREO El muestreo es por lo tanto una herramienta de la investigación científica, cuya función básica es determinar que parte de una población debe examinarse, con la finalidad de hacer inferencias sobre dicha población.

I.3 TIPOS DE MUESTREO ALEATORIO SIMPLE DISCRECIONAL BOLA DE NIEVE INTENCIONAL O CONVIVENCIA CUOTAS ALEATORIO CONGLOMERADO ALEATORIO ESTRATIFICADO ALEATORIO SISTEMÁTICO PROBABILÍSTICO NO PROBABILÍSTICO TIPOS DE MUESTREO

I.3.1 MUESTREO PROBABILÍSTICO Los métodos de muestreo probabilísticos son aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra.

A) MUESTREO ALEATORIO SIMPLE El procedimiento empleado es el siguiente: Se asigna un número a cada individuo de la población A través de algún medio mecánico (bolas dentro de una bolsa, tablas de números aleatorios, números aleatorios generados con una calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario para completar el tamaño de muestra requerido.

En lugar de extraer números aleatorios sólo se extrae uno. Se parte de ese número aleatorio ( i ), que es un número elegido al azar, y los elementos que integran la muestra son los que ocupa los lugares i, i+k , i+2k, i+3k,...,i+(n-1)k. Se toman los individuos de k en k, siendo k el resultado de dividir el tamaño de la población entre el tamaño de la muestra: k= N/n. B) MUESTREO ALEATORIO SISTEMÁTICO

C) MUESTREO ALEATORIO ESTRATIFICADO Consiste en considerar categorías diferentes entre sí (estratos) que poseen gran homogeneidad respecto a alguna característica (Profesión, municipio de residencia, el sexo, el estado civil, etc.). En ocasiones las dificultades que plantean son demasiado grandes, pues exige un conocimiento detallado de la población. (Tamaño geográfico, sexos, edades,...).

El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de conglomerados y en investigar después todos los elementos pertenecientes a los conglomerados elegidos. Las unidades hospitalarias, los departamentos universitarios, una caja de determinado producto, etc., son conglomerados naturales. Cuando los conglomerados son áreas geográficas suele hablarse de "muestreo por áreas". D) MUESTREO ALEATORIO POR CONGLOMERADOS

I.3.2 MUESTREO NO PROBABILÍSTICO En general se seleccionan a los sujetos siguiendo determinados criterios procurando, en la medida de lo posible, que la muestra sea representativa.

A) MUESTREO POR CUOTAS También denominado en ocasiones "accidental". En este tipo de muestreo se fijan unas "cuotas" que consisten en un número de individuos que reúnen unas determinadas condiciones, por ejemplo: 20 individuos de 25 a 40 años, de sexo femenino y residentes en G. Z.

B) MUESTREO INTENCIONAL O DE CONVENIENCIA Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras "representativas" mediante la inclusión en la muestra de grupos supuestamente típicos.

Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y así hasta conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos, etc. C) BOLA DE NIEVE

D) MUESTREO DISCRECIONAL A criterio del investigador los elementos son elegidos sobre lo que él cree que pueden aportar al estudio.

TIPOS DE DATOS Probabilidad y Estadística

Datos No agrupados Cuando el tamaño de muestra es menor a 30, los datos pueden tratarse individualmente, y en este caso se les llama Datos no agrupados. Probabilidad y Estadística

Datos agrupados Sin embargo, cuando la muestra es grande (n ≥ 30), es laborioso hacerlo de esta forma, por lo que se lleva a cabo algún tipo de agrupación preliminar para realizar el tratamiento adecuado a los datos. En este último caso, se les llama Datos Agrupados. Probabilidad y Estadística

Los intervalos de clase se emplean si las variables toman un número grande de valores o la variable es continua. Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente. Probabilidad y Estadística

Límites de clase Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase. Probabilidad y Estadística

Amplitud de la clase La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase. Probabilidad y Estadística

Marca de clase La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el cálculo de algunos parámetros. Probabilidad y Estadística

Ejemplo Probabilidad y Estadística Determine la tabla de frecuencias de los siguientes datos: 1.8, 1.9, 2, 2.4, 2.6, 2.8, 1.7, 1.9, 2.3, 1.6, 2.1, 3, 2.3, 2.7, 2.9, 1.5, 1.8, 2.6.

Ejemplo Determine la tabla de frecuencias de los siguientes datos: 3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13. Probabilidad y Estadística

Análisis de datos Medidas de tendencial central La medidas  de centralización  nos indican en torno a qué valor (centro) se distribuyen los datos.

Media La media aritmética es el valor obtenido al sumar todos los datos y dividir el resultado entre el número total de datos.   es el símbolo de la media aritmética.

Fórmula

Ejemplo Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.

Medidas de Tendencia Central para datos no agrupados: Mediana: 50% de las observaciones tienen un valor inferior a la mediana, y el otro 50% superior. Moda: Valor de las observaciones que tienen la mayor frecuencia.

Mediana Si el número de elementos es impar, se toma el dato central; si es par la mediana está dada por el promedio de los datos centrales, pudiéndose obtener un valor no dado en la muestra. Ejemplo: ¿Cuál es la mediana aritmética de 3, 4, 4, 5, 6, 8, 8, 10?  Como los números están ya ordenados, la mediana es Me = 5+6 / 2 = “5.5“, Otro ejemplo: 5.1, 6.5, 8.1, 9.1, 10.1, 15.5, Me = 8.1+9.1 / 2 = 8.6

Principales características de la mediana La mediana es un promedio de posición y por su forma de cálculo no es afectada por valores extremos. La mediana no está definida algebraicamente como lo está la media aritmética. La mediana en algunos casos, no puede ser calculada exactamente como sí puede serlo la media. Cuando el número de elementos incluidos en una serie de datos es par, la mediana es aproximadamente el punto medio de los elementos centrales en una serie de datos.

LA MODA (Mo) La moda se define como el valor que tiene la mayor frecuencia (o que se repite mas) en un grupo de datos, Hay casos en que la moda no es única, esto es, puede ser bimodal con dos modas, o trimodal con tres modas. También hay casos en que la moda no existe.

MODA PARA DATOS NO AGRUPADOS . Ejemplo: Cuál es la moda de la serie: 4, 5, 5, 6, 7, 7, 7, 8, 9, 1 La Moda es Mo = 7 porque es el número que más se repite.   Otro ejemplo: 60, 74, 82, 85, 90, 95, La moda no existe. Otro ejemplo: 10,12, 14, 16, 17, 17, 18, 19, 20, 20, 21. La moda es bimodal o sea, Mo = 17 y 20

Principales características de la Moda. La moda representa más elementos que cualquier otro valor dentro de un conjunto de datos. La moda no se calcula incluyendo todos los valores y no está definida algebraicamente como si lo está la media. La moda no es afectada por valores extremos. Para una distribución de frecuencias, la moda no puede ser calculada exactamente, como si puede serlo la media.

Desviación media (D. M.). Consiste en restar a cada una de las calificaciones su media y ésta diferencia se suma pero en valor absoluto , dividiéndose posteriormente entre n.   Ejemplo. x 1 x 2 x 3 x 4 x 5 8 10 5 4 3 La media aritmética es =  2   4   -1   -2   -3  Por lo tanto la desviación media será igual a:

Medidas de dispersión Desviación Estándar Habíamos visto que la varianza transforma todas las distancias a valores positivos elevándolas al cuadrado, con el inconveniente de elevar consigo las unidades de los datos originales.

Varianza La varianza mide la mayor o menor dispersión de los valores de la variable respecto a la media aritmética. Cuanto mayor sea la varianza mayor dispersión existirá y por tanto menor representatividad tendrá la media aritmética. La varianza se expresa en las mismas unidades que la variable analizada, pero elevadas al cuadrado.

Los derechos de las marcas mostradas en esta presentación pertenecen a sus respectivos titulares. Las fotografías, ilustraciones, videos y presentaciones graficas diversas son utilizados con fines académicos sin fines de lucro.