Ent r egables A C A 1 Asignatu r a B odega de datos Especialización Analista de Datos Presentado por Cristian Yesid Daza Gonzalez - Maria Fernanda Villamil Bejarano - Eric Andre Gallo Camargo - Felipe Antonio Bermudez Gi r aldo
E viden c ias del Ent r egable A C A 1 diseño de la arquitectura dimensional del Data Warehouse . Tecnologías adecuadas para implementar el Data Warehouse . Timeline que incluye los principales entregables, tiempos, y milestones . Pantallazo de un prototipo (no funcional) de un reporte o dashboard .
Diseño de la Arquitectura del Data Warehouse
Modelo de datos DWH
Opción Rendimiento Escalabilidad Facilidad de Implementación Costos (estimación mensual) Descripción Amazon Redshift Alto rendimiento para grandes volúmenes de datos; optimizado para SQL. Escalable, permite aumentar nodos según demanda. Alta, especialmente en ecosistema AWS. $300 - $1,000+ dependiendo del uso de nodos y almacenamiento. Ideal para consultas complejas en grandes volúmenes de datos, fácil integración con servicios AWS. Google BigQuery Muy alto, diseñado para análisis en tiempo real y consultas rápidas. Escalabilidad automática (serverless), se ajusta según las necesidades. Muy alta, fácil configuración sin gestión de infraestructura. $300 - $1,200+ (se paga por TB procesado y almacenamiento). Excelente para análisis en tiempo real; pagas solo por los datos consultados. Microsoft Azure Synapse Analytics Alto, especialmente para entornos de SQL y análisis complejos. Escalabilidad flexible con unidades de Data Warehouse (DWUs). Alta si se usa en conjunto con el ecosistema Azure. $400 - $1,500+ (costos basados en almacenamiento y DWUs). Integración con Power BI y otros servicios de Microsoft; ideal para usuarios de Azure. Snowflake Optimizado para alto rendimiento y consultas con múltiples fuentes. Escalabilidad separada para almacenamiento y cómputo. Muy alta, requiere poco mantenimiento. $500 - $1,500+ (costos separados por almacenamiento y cómputo). Ofrece escalabilidad granular, ideal para ambientes de multi-cloud. Oracle Autonomous Data Warehouse Alto rendimiento con autoajuste de recursos. Escalabilidad elástica y ajustable automáticamente. Alta, con configuración autónoma. $800 - $2,000+ (costos de licencias incluidas). Autogestionado y seguro, ideal para grandes empresas y ambientes críticos. Tecnologías adecuadas para implementar el Data Warehouse .
Fase Entregables Principales Tiempo Estimado Milestones (Hitos) Fase 1: Planificación y Análisis de Requerimientos - Documento de Requerimientos Semana 1-2 - Aprobación de Requerimientos - Análisis de Viabilidad y Tecnología - Selección de Tecnología - Selección de Herramientas y Plataforma Fase 2: Diseño de la Arquitectura y Modelo Dimensional - Diagrama de Arquitectura DW Semana 3-4 - Validación de Arquitectura - Esquema Dimensional (Modelo Estrella o Copo de Nieve) - Aprobación del Modelo de Datos - Definición de Tablas de Hechos y Dimensiones Fase 3: Configuración de Infraestructura y Seguridad - Configuración del Entorno DW (servidores, almacenamiento) Semana 5-6 - Infraestructura Lista - Configuración de Seguridad (acceso, autenticación) - Pruebas de Seguridad Completadas Fase 4: Desarrollo de Procesos ETL (Extracción, Transformación y Carga) - Desarrollo de Scripts ETL Semana 7-10 - ETL en Entorno de Pruebas - Pruebas de Carga Inicial de Datos - Carga de Datos Inicial Exitosa - Documentación del Proceso ETL Fase 5: Integración con Herramientas de BI y Reportes - Integración con Herramienta de BI (ej. Power BI, Tableau) Semana 11-13 - Reportes Prototipo Listos - Creación de Reportes Prototipo - Integración Validada - Pruebas de Integración Fase 6: Pruebas y Optimización del Sistema - Pruebas de Rendimiento y Escalabilidad Semana 14-15 - Pruebas Completadas - Optimización de Consultas - Optimización Final Aprobada - Ajustes Finales de ETL y DW Fase 7: Implementación en Producción - Migración a Producción Semana 16-17 - Lanzamiento en Producción - Capacitación a Usuarios y Personal de Soporte - Capacitación Completa - Documentación Final del Proyecto Fase 8: Monitoreo y Mantenimiento - Monitoreo Continuo del Rendimiento Semana 18 en adelante - Inicio de Soporte y Monitoreo - Soporte Técnico Inicial - Documentación de Incidencias Timeline del Proyecto de Data Warehouse