Análisis y Explotación de Datos - Clase 4 (1).pptx

RocioAnahiAlvarez 17 views 12 slides Aug 29, 2025
Slide 1
Slide 1 of 12
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10
Slide 11
11
Slide 12
12

About This Presentation

BIGDATA


Slide Content

Análisis y Explotación de Datos Profesor: Lic. Leonel Toro

Medidas de resumen para variables cualitativas Nos permiten describir la distribución de las categorías y extraer información relevante . Frecuencia Absoluta: Indica el número de veces que aparece cada categoría en el conjunto de datos Frecuencia Relativa/Proporción: Expresa la proporción de cada categoría respecto al total, se divide la frecuencia absoluta por el tamaño de la muestra. Porcentaje: Es una forma de expresar la frecuencia relativa en términos porcentuales. Es igual a la frecuencia relativa multiplicado por 100. Moda: Categoría que aparece con mayor frecuencia.

Identificación de patrones y tendencias en los datos Patrones: Son regularidades o repeticiones que encontramos en los datos. Tendencias: Son patrones que se mantienen a lo largo del tiempo y que nos indican una dirección o evolución. Son útiles para: Comprender el pasado: Saber qué ha ocurrido y por qué. Predecir el futuro: Anticipar posibles escenarios y tomar decisiones más informadas. Optimizar procesos: Identificar áreas de mejora y reducir costos. Descubrir oportunidades: Encontrar nuevas formas de hacer las cosas.

Funciones lógicas SI: Permite evaluar una condición y realizar una acción diferente dependiendo de si esa condición es VERDADERA o FALSA. Sintaxis: =SI(prueba _lógica; valor_si_verdadero; valor _si_falso) SI.CONJUNTO: permite evaluar múltiples condiciones y devolver un valor correspondiente a la primera condición que se cumpla. Sintaxis: =SI.CONJUNTO(prueba_lógica1; valor_si_verdadero1; [prueba_lógica2; valor_si_verdadero2]; ...) Y: Permite evaluar múltiples condiciones y devuelve VERDADERO sólo si todas las condiciones son VERDADERAS. Sintaxis: =Y(lógica1; [lógica2; ...) O: Permite evaluar múltiples condiciones y devuelve VERDADERO si alguna de las condiciones es VERDADERAS. Sintaxis: =O(lógica1; [lógica2]; ...) Son herramientas fundamentales para realizar análisis condicionales y tomar decisiones basadas en datos Estas funciones suelen utilizarse juntas para crear fórmulas más complejas. Generalmente usando Y u O dentro del argumento de “prueba_lógica” de la función SI.

Funciones de agregación condicionales SUMAR. SI: Suma los valores de un rango que cumplen un criterio Sintaxis: =SUMAR.SI(rango; criterio; [rango_suma]) SUMAR.SI.CONJUNTO: Suma los valores de un rango que cumplen múltiples criterios Sintaxis: =SUMAR.SI.CONJUNTO(rango_suma; rango_criterio1; criterio1; [rango_criterio2; criterio2];...) PROMEDIO.SI : Calcula el promedio de los valores de un rango que cumplen un criterio. Sintaxis: =PROMEDIO.SI( rango; criterio; [rango_promedio] ) PROMEDIO.SI.CONJUNTO: Calcula el promedio de los valores de un rango que cumplen múltiples criterios Sintaxis: =PROMEDIO .SI.CONJUNTO(rango_promedio; rango_criterio1; criterio1; [rango_criterio2; criterio2];...) CONTAR.SI : Cuenta el número de celdas de un rango que cumplen un criterio . Sintaxis: =CONTAR.SI(rango;criterio) CONTAR.SI.CONJUNTO: Cuenta el número de celdas de un rango que cumplen múltiples criterios. Sintaxis: =CONTAR.SI.CONJUNTO(rango_contar; rango_criterio1; criterio1; [rango_criterio2; criterio2];...) Permiten realizar operaciones matemáticas en un rango de datos pero solo en aquellos valores que cumplan una condición específica.

BUSCARV P ermite buscar un valor en la primera columna de una tabla y devolver un valor correspondiente de otra columna en la misma fila. Usos: Buscar información relacionada Automatizar tareas repetitivas Combinar tablas Pasos a seguir para combinar tablas: Identifica el campo común: Este campo debe existir en ambas tablas y contener los mismos valores para los registros relacionados. Organiza las tablas: Asegúrate de que el campo común esté en la primera columna de la tabla que usarás como referencia para BUSCARV. Aplica la función BUSCARV. Sintaxis: =BUSCARV(valor_buscado; rango; indice_columna; ordenado) valor_buscado es el valor que quieres buscar. Rango define el rango de celdas que contiene los datos. La primera columna de este rango debe contener la dirección del valor_buscado. Indice_columna es el número de columna del rango del que quieres recuperar el valor. ordenado es un valor lógico (VERDADERO o FALSO). Si es VERDADERO, se asume que la primera columna del rango está ordenada de forma ascendente y devuelve la coincidencia más cercana. Si es FALSO, se busca una coincidencia exacta.

Tablas Dinámicas Permiten agrupar, filtrar y resumir grandes conjuntos de datos de forma rápida y flexible facilitando la identificación de patrones, tendencias y la toma de decisiones. Flexibilidad: Permiten explorar los datos desde múltiples perspectivas, cambiando los campos y los cálculos sobre la marcha. Agilidad: Generan resúmenes y análisis complejos de forma rápida, ahorrando tiempo y esfuerzo. Visualización: Facilitan la comprensión de los datos a través de tablas y gráficos dinámicos. Filtrado: Permiten aislar segmentos específicos de los datos para un análisis más detallado.

Procedimiento para la creación de tablas dinámicas 1- Organizar los datos: Delimitar los datos en una tabla con encabezados claros para cada columna. 2- Seleccionar los datos: Resaltar el rango de datos que deseas analizar, incluyendo los encabezados. 3- Insertar tabla dinámica: Ir a la pestaña "Insertar" y seleccionar "Tabla dinámica". En el cuadro de diálogo, elegir dónde deseas colocar la tabla dinámica (nueva hoja o la hoja actual) y hacer click en "Aceptar". 4- Campo de tabla dinámica: A la izquierda de la pantalla aparecerá el campo de tabla dinámica, que contiene todos los campos de tu tabla de datos. Arrastrar los campos a las áreas correspondientes: Filas: Para agrupar los datos por categorías. Columnas: Para crear subgrupos dentro de las categorías. Valores: Para mostrar los datos numéricos que deseas analizar (sumas, promedios, cantidades, etc.). Filtros: Para filtrar los datos según criterios específicos. 5- Personalizar la tabla dinámica: Cambiar el tipo de cálculo: Haz clic derecho en un valor y selecciona el tipo de cálculo que deseas (suma, promedio, conteo, etc.). Formatear: Aplica formatos de número, fuentes y colores para mejorar la visualización. Filtrar: Utiliza los filtros para aislar los datos que te interesan. Ordenar: Ordena los datos de forma ascendente o descendente. 6- Crear gráficos dinámicos: Con los datos en la tabla dinámica, puedes crear gráficos dinámicos para visualizar los resultados de forma más clara.

¿Qué es el Modelado de Datos El análisis de datos no empieza en los gráficos ni en los informes: empieza en cómo se organizan los datos . Tener las tablas bien estructuradas y conectadas permite generar información confiable y más fácil de usar. O rganiza la información en tablas separadas por entidad. Las tablas se conectan mediante relaciones , evitando redundancia y errores. Facilita el análisis, el mantenimiento y la escalabilidad del modelo.

Entidades y Claves Cada tabla representa una entidad, es decir, un objeto sobre el que se registra información. Para poder relacionar las tablas y mantener la consistencia de los datos, usamos claves: Clave primaria (PK ): identifica de forma única cada registro. Ejemplo: DNI en Ciudadanos, Nº de expediente en Trámites. Clave foránea (FK) : conecta una tabla con otra mediante la PK. Ejemplo: DNI en Trámites conecta con Ciudadanos. Relacionar correctamente las tablas permite consultas y análisis cruzados sin duplicar datos .

Relaciones entre tablas Las tablas pueden ser de dos tipos: Hechos: contienen los eventos o transacciones que queremos analizar (ej. Trámites, Pagos, Incidencias). Dimensiones: contienen información descriptiva sobre los objetos (ej. Ciudadanos, Oficinas, Fechas). Las relaciones entre tablas permiten analizar los datos de manera consistente y flexible. Uno a Uno (1:1): cada registro de una tabla se relaciona con un solo registro de otra Uno a Muchos (1:*): una dimensión puede relacionarse con varios hechos. Muchos a Muchos (*:*): Requiere una tabla intermedia que actúa como puente.

¿Qué es Power Pivot?: El modelo relacional de Excel Power Pivot es un complemento que permite crear un modelo de datos relacional dentro de Excel , manejando varias tablas conectadas sin necesidad de combinarlas manualmente. Las relaciones definidas permiten crear tablas dinámicas, gráficos y aplicar filtros basados en varias tablas a la vez, sin duplicar datos. DAX (Data Analysis Expressions) : Es el lenguaje que permite crear cálculos y medidas sobre el modelo de datos, trabajando con varias tablas a la vez. Permite sumar, promediar, contar y generar métricas más complejas de manera consistente. Se puede usar para crear indicadores y métricas dinámicas que se actualizan según los filtros aplicados. Permite realizar comparaciones temporales como crecimiento mes a mes o acumulados anuales.
Tags