A2 -ETL-DataWareHouse-FABG - analis de datos

felipebermudez30 7 views 29 slides Oct 22, 2025
Slide 1
Slide 1 of 29
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10
Slide 11
11
Slide 12
12
Slide 13
13
Slide 14
14
Slide 15
15
Slide 16
16
Slide 17
17
Slide 18
18
Slide 19
19
Slide 20
20
Slide 21
21
Slide 22
22
Slide 23
23
Slide 24
24
Slide 25
25
Slide 26
26
Slide 27
27
Slide 28
28
Slide 29
29

About This Presentation

A2 -ETL-DataWareHouse-FABG


Slide Content

A2 ETL- DataWareHouse Presentado por: FELIPE Antonio Bermúdez Giraldo Ingeniero de sistemas y telecomunicaciones Fecha de entrega: 17/01/2025

Prerrequisitos MÍNIMOS NECESARIOS SU EQUIPO DE CÓMPUTO

Objetivos específicos

Objetivo 1: Siguiendo los pasos para la creación del DataLake , procederemos a crear las ETL necesarias para alimentar el Data Warehouse (DWH). El primer paso será crear el paquete correspondiente a la tabla DIM_Departamento . Pasos: Crear paquete ETL para cargar Departamentos al Data Warehouse . 1

Objetivo 1: La primera conexión será al DataLake , siguiendo los mismos pasos realizados durante su creación. Pasos: Crear paquete ETL para cargar Departamentos al Data Warehouse . 1

Objetivo 1: Como ya existía un historial de la conexión al DataLake , se selecciona directamente, tal como se muestra en la imagen. Creamos la conexión para el Data Warehouse (DWH) siguiendo los mismos pasos. Esta vez, seleccionamos la base de datos correspondiente al DWH y realizamos la prueba de conexión para asegurarnos de que todo funciona correctamente. Pasos: Crear paquete ETL para cargar Departamentos al Data Warehouse . 1 2

Objetivo 1: iguiendo la misma lógica utilizada para la creación del DataLake , construiremos las ETL necesarias para el Data Warehouse (DWH). En el primer paso del flujo de datos, se realiza la eliminación de la tabla existente. En este paso, se procede a crear la tabla en el Data Warehouse (DWH). En este paso, se consulta la información del DataLake y se transfiere al Data Warehouse (DWH). Pasos: Crear paquete ETL para cargar Departamentos al Data Warehouse . 1 2 3

Objetivo 1: Primero, se selecciona un origen ADO.NET (ADO.NET Source ) para indicar de qué base de datos (BD) se obtendrá la información; en este caso, del DataLake . Seleccionamos un destino ADO.NET (ADO.NET Destination ) para indicar en qué base de datos (BD) se guardará la información. Pasos: Crear paquete ETL para cargar Departamentos al Data Warehouse . 1 2

Objetivo 1: Primero, se selecciona un origen ADO.NET (ADO.NET Source ) para indicar de qué base de datos (BD) se tomará la información; en este caso, del DataLake . Seleccionamos un destino ADO.NET (ADO.NET Destination ) para indicar en qué base de datos (BD) se almacenará la información. En el destino, seleccionamos la conexión del Data Warehouse (DWH). Seleccionamos la tabla de destino en nuestro Data Warehouse (DWH). Pasos: Crear paquete ETL para cargar Departamentos al Data Warehouse . 1 2 3 4

Objetivo 1: Cambiamos los nombres y, de esta manera, quedaría configurado el consumo y almacenamiento de los datos en nuestro Data Warehouse (DWH). Pasos: Crear paquete ETL para cargar Departamentos al Data Warehouse . 1

Objetivo 1: Realizamos la prueba de ejecución de toda la ETL y obtenemos un resultado exitoso. Pasos: Crear paquete ETL para cargar Departamentos al Data Warehouse . 1

Seguimos los mismos pasos utilizados para la ETL de DL_Departamento , esta vez para crear DL_Municipios . Luego, realizamos la prueba correspondiente. Pasos: Objetivo 2: Crear paquete ETL para cargar Municipios al Data Warehouse . 1

Para la DIM_Zona , seguimos los mismos pasos que en las dimensiones anteriores, pero el consumo de la información será ligeramente diferente. Pasos: Objetivo 3: Crear paquete ETL para cargar Zonas al Data Warehouse . 1

Para el consumo de datos, seleccionamos la tabla DL_Homicidios . Dado que el nombre de la zona viene con un tipo de dato nvarchar (50) , pero en realidad solo necesitamos un nvarchar (8) que es el tamaño máximo requerido y así está configurado en el DWH, realizaremos una conversión de datos. Almacenamos la información en el DWH, en la tabla DIM_Zonas . Pasos: Objetivo 3: Crear paquete ETL para cargar Zonas al Data Warehouse . 1 2 3

Para el consumo de datos, tomaremos el campo ZONA de la tabla DL_Homicidios . De esta tabla, debemos consumir los datos mediante una consulta ( query ) que nos permita obtener solo los valores únicos. Así es como configuraremos el campo ZONA para que pase de nvarchar (50) a nvarchar (8). Pasos: Objetivo 3: Crear paquete ETL para cargar Zonas al Data Warehouse . 2 1

Validamos la ejecución completa y verificamos que todo haya salido exitoso. Pasos: Objetivo 3: Crear paquete ETL para cargar Zonas al Data Warehouse . 1

Realizamos el mismo procedimiento anterior para la tabla DIM_Sexos . Validamos que se registraron correctamente los 3 registros únicos del campo SEXO. Pasos: Objetivo 4: Crear paquete ETL para cargar Sexos al Data Warehouse . 1 2

Realizamos los primeros pasos de eliminación y creación de la tabla, siguiendo los mismos pasos anteriores. Pasos: Objetivo 5: Crear paquete ETL para cargar Homicidios al Data Warehouse .. 1

Vamos a agregar un nuevo ítem que nos ayudará a encontrar los demás campos que conforman la tabla FAC. Pasos: Objetivo 5: Crear paquete ETL para cargar Homicidios al Data Warehouse .. 1

brimos el elemento, nos dirigimos a "Conexión" y hacemos clic en "Nuevo". Se configura la conexión según lo indica la imagen. Pasos: Objetivo 5: Crear paquete ETL para cargar Homicidios al Data Warehouse .. 1 2

Configuramos la tabla "Zona" para que nos traiga el campo "COD_ZONA", que irá en la tabla FAC. Pasos: Objetivo 5: Crear paquete ETL para cargar Homicidios al Data Warehouse .. 1

Realizamos el mismo procedimiento para el campo "COD_SEXO". Pasos: Objetivo 5: Crear paquete ETL para cargar Homicidios al Data Warehouse .. 1

Ejecutamos las ETL para probar que todo se ejecute con normalidad. Pasos: Objetivo 5: Crear paquete ETL para cargar Homicidios al Data Warehouse .. 1

Configuramos la tarea para que cada uno de los paquetes se ejecute en una sola ejecución, de modo que se ejecuten todas las ETL creadas. Pasos: Objetivo 6: Crear paquete ETL Principal. 1

Probamos la ejecución del paquete principal y observamos que se ejecuta sin problemas. Pasos: Objetivo 6: Crear paquete ETL Principal. 1

Dificultades y Soluciones

Recursos utilizados

Conclusiones

Conclusiones
Tags