INFORMÁTICA II ASIGNATURA Sesión 07 1 Profesora : Dra. Elodia Mayca Julca Profesor : Mg. Alberto Yopla Mercado Profesora : Mg. Deysi Acosta Ticse Profesor : Mg. José Rodríguez Parra
OBJETIVOS Emplea herramientas tecnológicas que le permitan lograr una comunicación asertiva para la formulación de documentos y presentaciones en entornos militares, administrativos, académicos y culturales. 2
CONTENIDO 3 Sesión Horas Contenido 4 4 3. Herramienta de gestión de base de datos Sistema de gestión de base de datos relacional Estructura de la base de datos Tablas, campos, registro Creación de Base de datos, tablas (vista diseño, tipo de dato, propiedades, clave primaria) en MS Access Relaciones entre tablas UNIDAD I: FUNCIONES DE EXCEL Y HERRAMIENTAS PARA EL ANÁLISIS DE DATOS
Conocimientos previos ¿Que entiendes sobre Base de Datos? 4 Imagen obtenida de: https://glofacts.com/wp-content/uploads/2021/08/awkward-feelings-right-path.jpg
Logro de aprendizaje Al finalizar la unidad, el estudiante aplica las técnicas para el diseño de un modelo de datos de una Base de Datos relacional. 5
Conceptos Generales de BD Relacionales Una base de datos relacional es un tipo de base de datos que almacena y proporciona acceso a puntos de datos relacionados entre sí. Las bases de datos relacionales se basan en el modelo relacional, una forma intuitiva y directa de representar datos en tablas. 6
Base de datos - Definición Una BD es un conjunto o compilación de datos ordenados, organizados y relacionados de modo tal que resulte fácil acceder a ellos y generar nueva información. El propósito principal de las bases de datos es ayudar al descubrimiento del conocimiento. La BD en general es un puente entre el dato acumulado y la información; es una forma de convertir materia prima en materia utilizable por el usuario. Almacenar datos no es el objetivo principal de las bases de datos. Ejemplo: Internet es un almacén de datos pero no una base de datos.
Tipos de bases de datos (BD) Planas : tablas simples sin relaciones (CSV, Excel). Relacionales: s on sistemas de BD que organizan la información en tablas estructuradas compuestas por filas y columnas, donde los datos están relacionados entre sí mediante claves primarias y foráneas. Utilizan el lenguaje SQL para consultar, modificar y gestionar los datos, y aseguran integridad, consistencia y eliminación de redundancias (Microsoft ACCESS) Especializadas : están diseñadas para gestionar tipos de información complejos que no se manejan eficientemente en bases de datos tradicionales. Algunos ejemplos son: GD de series temporales complejas, BD geoespaciales, etc. No relacionales (NoSQL) : s on sistemas de BD diseñados para almacenar y gestionar grandes volúmenes de datos no estructurados o semiestructurados, sin necesidad de seguir el modelo tradicional de tablas y relaciones (Ejemplo: MongoDB, Cassandra , entre otros) .
Motores 9 Microsoft Access es una herramienta de base de datos relacional que forma parte de la suite de Microsoft Office. Permite crear y gestionar bases de datos de forma sencilla, incluyendo tablas, consultas, formularios e informes, para organizar, almacenar y analizar información.
Integridad Se denomina integridad referencial y consiste en que los datos que referencian otros (claves foráneas) deben ser correctos. La integridad referencial hace que el sistema gestor de la base de datos se asegure de que no hayan en las claves foráneas valores que no estén en la tabla principal. 10
Redundancia la redundancia de datos o el sistema redundante, se produce cuando se almacenan varias copias de la misma información en más de un lugar a la vez. Este desafío afecta a organizaciones de todos los tamaños en todas las industrias y conduce a costos de almacenamiento elevados, errores y análisis comprometidos. 11
Componentes Lógicos Un modelo lógico contiene representaciones de entidades y atributos, relaciones, identificadores exclusivos, subtipos y supertipos y restricciones entre relaciones. Un modelo lógico también puede contener objetos de modelo de dominio o referirse a uno o varios modelos de dominio o de glosario. Una vez definidas las relaciones y los objetos lógicos en un modelo lógico de datos, utilice el área de trabajo para transformar el modelo lógico en una representación física específica de la base de datos en forma de modelo físico de datos. 12
Registro de Datos Una base de datos se divide en diferentes columnas, en las cuáles se fracciona la información correspondiente a cada registro. Cada una de estas columnas se denominan campos de la base de datos. 13
Transacciones Componentes Físicos Todas las bases de datos tienen un registro de transacciones que registra todas las transacciones y las modificaciones que cada transacción realiza en la base de datos. El registro de transacciones es un componente esencial de la base de datos. Si hay un error del sistema, ese registro es necesario para devolver la base de datos a un estado coherente. 14
Archivos y grupos de archivos Relaciones entre entidades: Diseño Conceptual Las especificaciones de requisitos de usuario y su resultado es el esquema conceptual de la base de datos. Un esquema conceptual es una descripción de alto nivel de la estructura de la base de datos, independientemente del sistema de gestión de base de datos que se vaya a utilizar para manipularla. Un modelo conceptual es un lenguaje que se utiliza para describir esquemas conceptuales. El objetivo del diseño conceptual es describir el contenido de información de la base de datos y no las estructuras de almacenamiento que se necesitarán para manejar esta información 15
Archivos y grupos de archivos Relaciones entre entidades: Diseño Lógico El esquema conceptual y da como resultado un esquema lógico. Un esquema lógico es una descripción de la estructura de la base de datos en términos de las estructuras de datos que puede procesar un tipo de sistema manejador de base de datos. Un modelo lógico es un lenguaje usado para especificar esquemas lógicos (modelo relacional, modelo de red, etc.). El diseño lógico depende del tipo de sistema de gestión de base de datos que se vaya a utilizar, no depende del producto concreto. 16
Archivos y grupos de archivos Relaciones entre entidades: Diseño Físico El esquema lógico y da como resultado un esquema físico. Un esquema físico es una descripción de la implementación de una base de datos en memoria secundaria: las estructuras de almacenamiento y los métodos utilizados para tener un acceso eficiente a los datos. Por ello, el diseño físico depende del sistema de gestión de base de datos concreto y el esquema físico se expresa mediante su lenguaje de definición de datos. 17
Archivos y grupos de archivos Relaciones entre entidades: Diseño Físico 18
Cada paciente, sujeto o muestra de estudio debe tener un código que lo identifique de manera inequívoca HC = Numero de historia clínica Nota: Los nombres no reemplazan a un código de identificación.
Etiquetar de manera correcta cada campo
Campos que no pueden ser analizados estadísticamente Campos que pueden ser analizados estadísticamente Problema con los datos
Problema: Ausencia de etiqueta para variables cualitativas codificadas
Problema: La base de datos en una hoja de Excel no es una unidad
Evitar etiquetar los campos usando múltiples filas (a) Forma incorrecta : (b) Forma correcta :
Cada tabla debe tener los mismos rótulos y en el mismo orden TABLA 1 TABLA 2 Archivos que serán unidos
Etiqueta de campo (variable) adecuada para estudios de seguimiento a) Forma incorrecta b) Forma correcta S = Semana
Descripción de las variables del archivo Variable Niveles Código Todas las tablas de datos deben incluir una hoja con la descripción completa de las variables !!!
1: Problema de base de datos: La redundancia de datos
Tabla con datos demográficos Tabla con datos oftalmológicos Solución: Separar en tablas diferentes cada aspecto a describir Microsoft Access
Microsoft Access
Limpieza de datos Es una etapa fundamental en todo análisis estadístico. Se considerarán las siguientes situaciones comunes: Datos faltantes : Se identificarán y cuantificarán los valores ausentes en las variables. Dependiendo del patrón y la proporción de datos faltantes, se decidirá entre su imputación o exclusión. Variables irrelevantes : Se eliminarán las columnas que no aportan información útil para responder a las preguntas de investigación. Duplicación de registros : Se detectarán y eliminarán filas repetidas que puedan sesgar los resultados del análisis. Valores atípicos : En el caso de variables cuantitativas, se identificarán outliers mediante métodos estadísticos. Su tratamiento dependerá del contexto y del impacto que tengan sobre los estadísticos de interés; no se eliminarán automáticamente. Errores tipográficos : En variables cualitativas, se revisará la consistencia de las categorías mediante técnicas de exploración para corregir errores de codificación o escritura.
Conclusiones Mis diseños de tablas de una base de datos afecta a la congruencia de debe existir Mi diseño de base de datos debe cubrir los requerimientos dispuestos. La llave primaria de ayuda a evitar duplicados La llave primaria compuesta me ayuda a evitar duplicados cuando son tablas de detalle la llave foránea me ayuda a tener datos congruentes entre dos tablas 32
Bibliografía 33 Coronel, C., & Morris, S. (2020). Database Systems: Design, Implementation, & Management (13th ed.). Cengage Learning. Rob, P., & Coronel, C. (2018). Databases: Design and Application Development (7th ed.). Cengage Learning. Microsoft. (2024). Crear, ejecutar y guardar una consulta de selección . Recuperado de: https://support.microsoft.com/es-es/office/consultas-access García-Molina, H., Ullman, J. D., & Widom, J. (2019). Database Systems: The Complete Book (2nd ed.). Pearson.