1 2 CLASIFICACIONES DE LOS MÉTODOS ANALÍTICOS EJEMPLOS
El alumno distingue los diferentes métodos analíticos y las formas de tratamiento de datos, aplicándolos adecuadamente según el contexto. LOGRO DE LA SESIÓN
La clasificación de métodos analíticos en datos es un proceso mediante el cual se agrupan y organizan las diferentes técnicas utilizadas para analizar conjuntos de datos, según su finalidad, tipo de datos, nivel de complejidad o enfoque metodológico. Esta clasificación permite seleccionar el método más adecuado según el objetivo del análisis, facilitando la toma de decisiones basada en evidencia CLASIFICACIÓN DE LOS MÉTODOS ANALITICOS
IMPORTANCIA Facilita la toma de decisiones informadas. Identifica patrones y tendencias. Optimiza procesos en diversas industrias. Permite realizar predicciones y recomendaciones.
ANALISIS DESCRIPTIVO Este tipo de análisis no predice ni explica causas, simplemente describe lo que los datos muestran. Se centra en organizar, visualizar y resumir la información para facilitar su interpretación. Medidas estadísticas básicas (media, mediana, moda, desviación estándar, varianza, percentiles, etc.) Distribución de frecuencias (tabla de frecuencias, histogramas) Visualización de datos (Gráficos de barras, Gráficos de líneas, Histogramas, Diagramas de caja ( boxplot ), Tortas o gráficos circulares).
ANALISIS DIAGNOSTICO Este análisis profundiza en los datos para encontrar relaciones, correlaciones o patrones que expliquen ciertos fenómenos. Es especialmente útil cuando se desea tomar decisiones correctivas o mejorar procesos. Análisis de correlación Análisis de regresión Segmentación o agrupamiento
ANALISIS DIAGNOSTICO import numpy as np import pandas as pd import matplotlib.pyplot as plt # Datos de ejemplo horas_estudio = np.array ([ 1 , 2 , 3 , 4 , 5 , 6 , 7 ]) notas = np.array ([ 50 , 55 , 60 , 65 , 70 , 75 , 80 ]) # Crear DataFrame df = pd.DataFrame ({ 'Horas de Estudio' : horas_estudio , 'Nota' : notas }) # Cálculo de la correlación correlacion = df [ 'Horas de Estudio' ]. corr ( df [ 'Nota' ]) print ( f"Coeficiente de correlación: { correlacion : .2f } " ) # Visualización plt.figure ( figsize =( 8 , 5 )) plt.scatter ( df [ 'Horas de Estudio' ], df [ 'Nota' ], color = ' green ' ) plt.plot ( df [ 'Horas de Estudio' ], df [ 'Nota' ], linestyle = '--' , color = 'gray' ) plt.title ( 'Relación entre Horas de Estudio y Nota' ) plt.xlabel ( 'Horas de Estudio' ) plt.ylabel ( 'Nota' ) plt.grid ( True ) plt.tight_layout () plt.show ()
ANALISIS PREDICTIVO Este análisis utiliza modelos estadísticos, algoritmos de aprendizaje automático y técnicas matemáticas para identificar patrones y predecir resultados futuros. Regresión lineal simple o múltiple Árboles de decisión y bosques aleatorios ( Random Forest) Modelos de series temporales (ARIMA, Exponential Smoothing ) Modelos de clasificación
ANALISIS PREDICTIVO import numpy as np import pandas as pd import matplotlib.pyplot as plt # Datos históricos: presupuesto en miles y ventas en miles presupuesto = np.array ([ 1 , 2 , 3 , 4 , 5 ]) # miles de soles en publicidad ventas = np.array ([ 2 , 4 , 5 , 4 , 5 ]) # miles de soles en ventas # Crear DataFrame df = pd.DataFrame ({ 'Publicidad' : presupuesto, 'Ventas' : ventas}) # Calcular regresión lineal simple coef = np.polyfit ( df [ 'Publicidad' ], df [ 'Ventas' ], 1 ) # pendiente y ordenada pendiente, intercepto = coef # Función de predicción def predecir (x): return pendiente * x + intercepto # Crear valores de predicción x_pred = np.linspace ( , 6 , 100 ) y_pred = predecir( x_pred ) # Mostrar resultados print ( f"Modelo : Ventas = { pendiente : .2f } * Publicidad + { intercepto : .2f } " ) # Visualizar plt.figure ( figsize =( 8 , 5 )) plt.scatter ( df [ 'Publicidad' ], df [ 'Ventas' ], color = 'blue' , label = 'Datos reales' ) plt.plot ( x_pred , y_pred , color = 'red' , linestyle = '--' , label = 'Predicción' ) plt.title ( 'Análisis Predictivo: Publicidad vs Ventas' ) plt.xlabel ( 'Publicidad (miles de soles)' ) plt.ylabel ( 'Ventas (miles de soles)' ) plt.grid ( True ) plt.legend () plt.tight_layout () plt.show ()
ANALISIS PRESCRIPTIVO Este análisis utiliza modelos estadísticos, algoritmos de aprendizaje automático y técnicas matemáticas para identificar patrones y predecir resultados futuros. Optimización lineal y no lineal Simulación de escenarios ( what-if ) Algoritmos de decisión Análisis coste-beneficio
ANALISIS PRESCRIPTIVO import numpy as np import pandas as pd import matplotlib.pyplot as plt # Parámetros del problema precios_venta = 20 # precio de venta por unidad costos_unitarios = 8 # costo por unidad costos_fijos = 50 # costos fijos # Generar posibles cantidades de producción produccion = np.arange( , 21 ) # de 0 a 20 unidades # Calcular ingresos, costos totales y ganancias ingresos = precios_venta * produccion costos_totales = costos_unitarios * produccion + costos_fijos ganancia = ingresos - costos_totales # Crear DataFrame para visualizar df = pd.DataFrame({ 'Producción' : produccion, 'Ingresos' : ingresos, 'Costos Totales' : costos_totales, 'Ganancia' : ganancia }) # Encontrar el punto óptimo mejor_opcion = df[df[ 'Ganancia' ] == df[ 'Ganancia' ].max()] # Mostrar datos óptimos print ( "Mejor opción: \n " , mejor_opcion) # Visualización plt.figure( figsize =( 9 , 5 )) plt.plot(df[ 'Producción' ], df[ 'Ganancia' ], marker = 'o' , label = 'Ganancia' ) plt.axvline(mejor_opcion[ 'Producción' ].values[ ], color = 'red' , linestyle = '--' , label = 'Producción óptima' ) plt.title( 'Análisis Prescriptivo: Maximización de Ganancia' ) plt.xlabel( 'Unidades Producidas' ) plt.ylabel( 'Ganancia' ) plt.grid( True ) plt.legend() plt.tight_layout() plt.show()