Crear un DataWareHouse con ssis analis de datos

felipebermudez30 6 views 27 slides Oct 22, 2025
Slide 1
Slide 1 of 27
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10
Slide 11
11
Slide 12
12
Slide 13
13
Slide 14
14
Slide 15
15
Slide 16
16
Slide 17
17
Slide 18
18
Slide 19
19
Slide 20
20
Slide 21
21
Slide 22
22
Slide 23
23
Slide 24
24
Slide 25
25
Slide 26
26
Slide 27
27

About This Presentation

Crear un DataWareHouse


Slide Content

A1 Crear un DataWareHouse - DWH Presentado por: FELIPE Antonio Bermúdez Giraldo Ingeniero de sistemas y telecomunicaciones Fecha de entrega: 05/01/2025

Prerrequisitos MÍNIMOS NECESARIOS SU EQUIPO DE CÓMPUTO

Objetivos específicos

Objetivo 1: Nos dirigimos a la sección Databases , hacemos clic derecho y seleccionamos la opción Crear base de datos. Luego, hacemos clic en Aceptar para confirmar. Colocamos el nombre de la base de datos, en este caso, DWH, y hacemos clic en OK para confirmar la creación. Pasos: Crear base de datos DataWareHouse en el servidor de SQL Server 2022. 1 2

Nos dirigimos al esquema dbo , hacemos clic derecho y seleccionamos la opción Crear tabla . Estas tablas representarán las dimensiones que conformarán nuestro DWH y servirán como suministros para nuestra tabla de hechos. Luego, hacemos clic en Aceptar para confirmar. Asignamos un nombre a la tabla, en este caso, DIM_Departamento , y hacemos clic en OK para confirmar. Pasos: Objetivo 2: Crear modelo de datos (Tabla, Columnas y Llave Primaria) para la Dimensión de Departamentos. 1 2

Procedemos a agregar las columnas que tendrá la tabla. Para ello, hacemos clic en el ícono correspondiente para editar o agregar columnas. Escribimos el nombre de la columna en el campo correspondiente. Seleccionamos el tipo de dato adecuado para cada columna. Por ejemplo: Nombre_Departamento : Tipo de dato VARCHAR(50) o NVARCHAR(50) si necesitamos soportar caracteres especiales. Definimos el tamaño para los campos que lo requieran, especialmente aquellos de tipo texto. Una vez asignado el nombre, tipo de dato y tamaño, damos clic en Aceptar para confirmar la configuración de la columna. Pasos: Objetivo 2: Crear modelo de datos (Tabla, Columnas y Llave Primaria) para la Dimensión de Departamentos. 1 2 3 4

Una vez que todos los campos estén configurados, hacemos clic en SAVE para guardar la configuración de la tabla y finalizar su creación. Finalmente, damos clic en OK para ejecutar el script SQL, el cual creará el campo en la tabla DIM_Departamento con las configuraciones que hemos definido. Pasos: Objetivo 2: Crear modelo de datos (Tabla, Columnas y Llave Primaria) para la Dimensión de Departamentos. 1 2

Para crear un campo de tipo NVARCHAR, primero debemos identificar la longitud de caracteres que se van a ingresar. Esto asegura que la configuración sea correcta y evitará errores al ingresar la información. Utilizamos el script mostrado en la imagen para establecer el tamaño adecuado del campo. Asignamos el nombre adecuado al campo, por ejemplo, NOM_Departamento , para asegurarnos de que esté correctamente identificado en la tabla. Asignamos el tipo de dato y el tamaño según lo identificado. Marcamos la opción NOT NULL para que siempre se espere que se ingresen datos en este campo. Esto garantiza que el campo no pueda quedar vacío al insertar registros en la tabla. Pasos: Objetivo 2: Crear modelo de datos (Tabla, Columnas y Llave Primaria) para la Dimensión de Departamentos. 2 3 4 1

Para este caso, identificamos que el tipo de dato que recibirá el campo será DECIMAL. Este tipo de dato es adecuado para almacenar valores numéricos con decimales, como cantidades, precios o medidas, donde se necesita una precisión específica.Al configurar este tipo de dato, también debemos especificar la precisión y la escala (por ejemplo, DECIMAL(10, 2) para un número con hasta 10 dígitos, de los cuales 2 son decimales). Dado que el tipo de dato es DECIMAL, no es necesario asignar un tamaño específico, ya que el sistema lo asignará por defecto. Sin embargo, siempre es importante definir la precisión y la escala (por ejemplo, DECIMAL(10, 2)), lo cual permitirá controlar cuántos dígitos totales se pueden almacenar y cuántos de esos dígitos serán decimales. Marcamos la opción NOT NULL para que siempre se espere que se ingresen datos en este campo. Esto garantiza que el campo no pueda quedar vacío al insertar registros en la tabla. Acemos la misma configuración en este caso para el campo LONGITUD. Pasos: Objetivo 2: Crear modelo de datos (Tabla, Columnas y Llave Primaria) para la Dimensión de Departamentos. 1 2 3 4

A continuación, vamos a crear la clave primaria para la tabla. Para ello, damos clic en la opción Primary Key mostrada en la imagen, lo que nos permitirá seleccionar el campo que actuará como clave primaria (por ejemplo, COD_Departamento ). Damos clic en la opción mostrada en la imagen, lo que abrirá la tabla de configuración de la clave primaria. En esta tabla, seleccionamos el campo que actuará como la clave primaria, como COD_Departamento , y aseguramos que este campo sea único y no nulo para garantizar la integridad de los datos. Al señalar la tabla y seleccionar el campo que actuará como clave primaria, el sistema asignará automáticamente un nombre por defecto a la clave primaria. Señalamos el campo que actuará como clave primaria, el cual debe ser único ya que este identificará de manera exclusiva cada fila en la tabla. Por ejemplo, COD_Departamento debe ser único para cada registro. Pasos: Objetivo 2: Crear modelo de datos (Tabla, Columnas y Llave Primaria) para la Dimensión de Departamentos. 1 2 4 3

Al terminar la configuración de la clave primaria y demás campos, la tabla debería verse como se muestra en la imagen. Luego, damos clic en Save para guardar la configuración y así tendremos nuestra primera dimensión DIM_Departamento creada exitosamente. Pasos: Objetivo 2: Crear modelo de datos (Tabla, Columnas y Llave Primaria) para la Dimensión de Departamentos. 1

Ahora, seguimos los mismos pasos que utilizamos para crear la dimensión DIM_Departamento para crear la dimensión DIM_Municipio . Asegúrate de que los campos de la dimensión DIM_Municipio queden configurados como se muestra en la imagen. Pasos: Objetivo 3: Crear modelo de datos (Tabla, Columnas, Llaves y Relación) para la Dimensión de Municipios. 1 2

Para establecer la relación entre la tabla DIM_Municipio y la tabla DIM_Departamento , debemos crear una clave foránea. Esto establece una relación de uno a muchos entre DIM_Departamento y DIM_Municipio . Para crear la clave foránea, seleccionamos los campos que se relacionarán entre las tablas DIM_Municipio y DIM_Departamento Una vez seleccionados los campos, confirmamos la configuración de la clave foránea y damos clic en Aceptar, luego en Save para guardar. Pasos: Objetivo 3: Crear modelo de datos (Tabla, Columnas, Llaves y Relación) para la Dimensión de Municipios. 1 2 3

Para crear un diagrama de entidad-relación que muestre cómo quedarán relacionadas las tablas, sigue estos pasos:Damos clic en la opción que muestra la imagen para generar el diagrama.Se abrirá una ventana o vista que nos permitirá seleccionar las tablas que están relacionadas.Señalamos las tablas DIM_Municipio y DIM_Departamento , y el sistema mostrará cómo estas tablas están vinculadas a través de la clave foránea COD_Departamento.Este diagrama visual nos ayudará a entender mejor la estructura de las tablas y sus relaciones. Pasos: Objetivo 3: Crear modelo de datos (Tabla, Columnas, Llaves y Relación) para la Dimensión de Municipios. 1

Para crear la dimensión DIM_Zona , seguimos los mismos pasos que usamos para las dimensiones anteriores. Damos clic en el ícono que muestra la imagen para agregar los campos a la tabla DIM_Zona . Esto nos permitirá añadir las columnas necesarias, como COD_Zona y NOM_Zona.Después de agregar los campos, asignamos los tipos de datos y configuramos las restricciones necesarias para cada campo (por ejemplo, asignar INT a COD_Zona y NVARCHAR(50) a NOM_Zona ). Luego, podemos proceder con la creación de la clave primaria y guardar la tabla. En la dimensión DIM_Zona , vamos a asignar el campo de la clave primaria como un campo Identity , lo que significa que se autoincrementará automáticamente cada vez que se agregue un nuevo registro a la tabla. Pasos: Objetivo 4: Crear modelo de datos (Tabla, Columnas y Llave Primaria) para la Dimensión de Zonas. 1 2 3

Para crear la dimensión DIM_Sexo , seguimos los mismos pasos que usamos para las dimensiones anteriores. En esta dimensión DIM_ Sexo , el campo COD_Sexo será auto-incrementable y también se establecerá como la clave primaria. Pasos: Objetivo 5: Crear modelo de datos (Tabla, Columnas y Llave Primaria) para la Dimensión de Sexos. 1 2

Para crear la DIM_Fecha , que nos permitirá configurar diferentes periodos de tiempo (como días, meses, trimestres, años) al relacionarla con nuestra tabla de hechos. La tabla DIM_Fecha debe quedar configurada de la siguiente manera para permitir un análisis temporal eficiente y flexible en la relación con la tabla de hechos. Pasos: Objetivo 6: Crear modelo de datos (Tabla, Columnas, Llaves y Relaciones) para los Hechos de Homicidios. 1 2

Pasos: Objetivo 6: Crear modelo de datos (Tabla, Columnas, Llaves y Relaciones) para los Hechos de Homicidios. 1 2 La tabla de hechos se debe configurar siguiendo los mismos pasos que utilizaste para crear las dimensiones, con la diferencia de que esta tabla debe almacenar los datos cuantitativos, los cuales se relacionarán con las dimensiones previamente creadas La tabla de hechos se configura con los campos como se muestra en la imagen, siguiendo los mismos pasos que utilizamos para crear las dimensiones. Esta tabla contiene las métricas o hechos que se van a analizar y se relaciona con las tablas de dimensiones a través de claves foráneas.

Pasos: Objetivo 6: Crear modelo de datos (Tabla, Columnas, Llaves y Relaciones) para los Hechos de Homicidios. La tabla de hechos debe quedar configurada de la siguiente manera. 1

Pasos: Objetivo 6: Crear modelo de datos (Tabla, Columnas, Llaves y Relaciones) para los Hechos de Homicidios. Una vez configurados los campos de la tabla de hechos, es necesario asignar la clave primaria para garantizar que cada registro de la tabla sea único. 1

Pasos: Objetivo 6: Crear modelo de datos (Tabla, Columnas, Llaves y Relaciones) para los Hechos de Homicidios. Las claves foráneas son esenciales para relacionar la tabla de hechos con las dimensiones que has creado previamente. Estas claves permiten establecer vínculos entre las tablas, asegurando que los datos de la tabla de hechos se correspondan correctamente con los de las dimensiones. 1

Pasos: Objetivo 6: Crear modelo de datos (Tabla, Columnas, Llaves y Relaciones) para los Hechos de Homicidios. Una vez que hayas asignado las claves primarias y foráneas en la tabla de hechos, es fundamental verificar las relaciones entre las tablas mediante un diagrama de entidad-relación (ER). Este diagrama visualiza cómo las tablas están interconectadas, permitiendo una comprensión clara de la estructura de la base de datos. 3

Pasos: Objetivo 7: Identificar las diferencias entre un Esquema Estrella y un Esquema Copo de Nieve. Por qué usar el Esquema Estrella: Simplicidad : Estructura directa y fácil de entender. Mejor rendimiento : Menos joins , lo que acelera las consultas. Facilidad de mantenimiento : Menos complejidad en la gestión de datos. El Esquema Estrella es ideal para un DWH porque facilita consultas rápidas y es fácil de gestionar y mantener. Característica Esquema Estrella Esquema Copo de Nieve Estructura Hechos conectados directamente a dimensiones. Hechos conectados a dimensiones normalizadas. Normalización No normalizado. Normalizado. Rendimiento Mejor rendimiento por menos joins. Peor rendimiento debido a más joins. Mantenimiento Fácil de mantener. Más difícil de mantener. Consultas Consultas rápidas. Consultas más lentas. Redundancia Alta redundancia en dimensiones. Menor redundancia.

Dificultades y Soluciones

Recursos utilizados

Conclusiones

Conclusiones