SESIÓN 03 - METODOS ANALITICOS EN BIG DATA

NIXONOMARFERNNDEZCAR1 13 views 14 slides Sep 12, 2025

Slide 1 of 14

About This Presentation

METODOS ANALITICOS EN BIG DATA

Size: 2.74 MB

Language: es

Added: Sep 12, 2025

Slides: 14 pages

Slide Content

BIG DATA DR. NIXON OMAR FERNANDEZ CARRIÓN

1 2 CLASIFICACIONES DE LOS MÉTODOS ANALÍTICOS EJEMPLOS

El alumno distingue los diferentes métodos analíticos y las formas de tratamiento de datos, aplicándolos adecuadamente según el contexto. LOGRO DE LA SESIÓN

La clasificación de métodos analíticos en datos es un proceso mediante el cual se agrupan y organizan las diferentes técnicas utilizadas para analizar conjuntos de datos, según su finalidad, tipo de datos, nivel de complejidad o enfoque metodológico. Esta clasificación permite seleccionar el método más adecuado según el objetivo del análisis, facilitando la toma de decisiones basada en evidencia CLASIFICACIÓN DE LOS MÉTODOS ANALITICOS

IMPORTANCIA Facilita la toma de decisiones informadas. Identifica patrones y tendencias. Optimiza procesos en diversas industrias. Permite realizar predicciones y recomendaciones.

ANALISIS DESCRIPTIVO Este tipo de análisis no predice ni explica causas, simplemente describe lo que los datos muestran. Se centra en organizar, visualizar y resumir la información para facilitar su interpretación. Medidas estadísticas básicas (media, mediana, moda, desviación estándar, varianza, percentiles, etc.) Distribución de frecuencias (tabla de frecuencias, histogramas) Visualización de datos (Gráficos de barras, Gráficos de líneas, Histogramas, Diagramas de caja ( boxplot ), Tortas o gráficos circulares).

ANALISIS DESCRIPTIVO import pandas as pd import matplotlib.pyplot as plt # Datos de ejemplo datos = { 'Mes' : [ 'Enero' , 'Febrero' , 'Marzo' , 'Abril' , 'Mayo' ], 'Ventas' : [ 100 , 150 , 200 , 170 , 130 ]} df = pd.DataFrame(datos) # Crear gráfico de líneas plt.figure( figsize =( 8 , 5 )) plt.plot(df[ 'Mes' ], df[ 'Ventas' ], marker = 'o' , color = 'blue' , linestyle = '-' ) plt.title( 'Ventas Mensuales' ) plt.xlabel( 'Mes' ) plt.ylabel( 'Ventas' ) plt.grid( True ) plt.tight_layout() # Mostrar gráfico plt.show() plt.savefig ( 'grafico_ventas_descriptivo.png' ) plt.close ()

ANALISIS DIAGNOSTICO Este análisis profundiza en los datos para encontrar relaciones, correlaciones o patrones que expliquen ciertos fenómenos. Es especialmente útil cuando se desea tomar decisiones correctivas o mejorar procesos. Análisis de correlación Análisis de regresión Segmentación o agrupamiento

ANALISIS DIAGNOSTICO import numpy as np import pandas as pd import matplotlib.pyplot as plt # Datos de ejemplo horas_estudio = np.array ([ 1 , 2 , 3 , 4 , 5 , 6 , 7 ]) notas = np.array ([ 50 , 55 , 60 , 65 , 70 , 75 , 80 ]) # Crear DataFrame df = pd.DataFrame ({ 'Horas de Estudio' : horas_estudio , 'Nota' : notas }) # Cálculo de la correlación correlacion = df [ 'Horas de Estudio' ]. corr ( df [ 'Nota' ]) print ( f"Coeficiente de correlación: { correlacion : .2f } " ) # Visualización plt.figure ( figsize =( 8 , 5 )) plt.scatter ( df [ 'Horas de Estudio' ], df [ 'Nota' ], color = ' green ' ) plt.plot ( df [ 'Horas de Estudio' ], df [ 'Nota' ], linestyle = '--' , color = 'gray' ) plt.title ( 'Relación entre Horas de Estudio y Nota' ) plt.xlabel ( 'Horas de Estudio' ) plt.ylabel ( 'Nota' ) plt.grid ( True ) plt.tight_layout () plt.show ()

ANALISIS PREDICTIVO Este análisis utiliza modelos estadísticos, algoritmos de aprendizaje automático y técnicas matemáticas para identificar patrones y predecir resultados futuros. Regresión lineal simple o múltiple Árboles de decisión y bosques aleatorios ( Random Forest) Modelos de series temporales (ARIMA, Exponential Smoothing ) Modelos de clasificación

ANALISIS PREDICTIVO import numpy as np import pandas as pd import matplotlib.pyplot as plt # Datos históricos: presupuesto en miles y ventas en miles presupuesto = np.array ([ 1 , 2 , 3 , 4 , 5 ]) # miles de soles en publicidad ventas = np.array ([ 2 , 4 , 5 , 4 , 5 ]) # miles de soles en ventas # Crear DataFrame df = pd.DataFrame ({ 'Publicidad' : presupuesto, 'Ventas' : ventas}) # Calcular regresión lineal simple coef = np.polyfit ( df [ 'Publicidad' ], df [ 'Ventas' ], 1 ) # pendiente y ordenada pendiente, intercepto = coef # Función de predicción def predecir (x): return pendiente * x + intercepto # Crear valores de predicción x_pred = np.linspace ( , 6 , 100 ) y_pred = predecir( x_pred ) # Mostrar resultados print ( f"Modelo : Ventas = { pendiente : .2f } * Publicidad + { intercepto : .2f } " ) # Visualizar plt.figure ( figsize =( 8 , 5 )) plt.scatter ( df [ 'Publicidad' ], df [ 'Ventas' ], color = 'blue' , label = 'Datos reales' ) plt.plot ( x_pred , y_pred , color = 'red' , linestyle = '--' , label = 'Predicción' ) plt.title ( 'Análisis Predictivo: Publicidad vs Ventas' ) plt.xlabel ( 'Publicidad (miles de soles)' ) plt.ylabel ( 'Ventas (miles de soles)' ) plt.grid ( True ) plt.legend () plt.tight_layout () plt.show ()

ANALISIS PRESCRIPTIVO Este análisis utiliza modelos estadísticos, algoritmos de aprendizaje automático y técnicas matemáticas para identificar patrones y predecir resultados futuros. Optimización lineal y no lineal Simulación de escenarios ( what-if ) Algoritmos de decisión Análisis coste-beneficio

ANALISIS PRESCRIPTIVO import numpy as np import pandas as pd import matplotlib.pyplot as plt # Parámetros del problema precios_venta = 20 # precio de venta por unidad costos_unitarios = 8 # costo por unidad costos_fijos = 50 # costos fijos # Generar posibles cantidades de producción produccion = np.arange( , 21 ) # de 0 a 20 unidades # Calcular ingresos, costos totales y ganancias ingresos = precios_venta * produccion costos_totales = costos_unitarios * produccion + costos_fijos ganancia = ingresos - costos_totales # Crear DataFrame para visualizar df = pd.DataFrame({ 'Producción' : produccion, 'Ingresos' : ingresos, 'Costos Totales' : costos_totales, 'Ganancia' : ganancia }) # Encontrar el punto óptimo mejor_opcion = df[df[ 'Ganancia' ] == df[ 'Ganancia' ].max()] # Mostrar datos óptimos print ( "Mejor opción: \n " , mejor_opcion) # Visualización plt.figure( figsize =( 9 , 5 )) plt.plot(df[ 'Producción' ], df[ 'Ganancia' ], marker = 'o' , label = 'Ganancia' ) plt.axvline(mejor_opcion[ 'Producción' ].values[ ], color = 'red' , linestyle = '--' , label = 'Producción óptima' ) plt.title( 'Análisis Prescriptivo: Maximización de Ganancia' ) plt.xlabel( 'Unidades Producidas' ) plt.ylabel( 'Ganancia' ) plt.grid( True ) plt.legend() plt.tight_layout() plt.show()

SESIÓN 03 - METODOS ANALITICOS EN BIG DATA

About This Presentation

Slide Content

Tags

Categories

Download

Quick Actions

Statistics

Related Slideshows

SESIÓN 03 - METODOS ANALITICOS EN BIG DATA

About This Presentation

Slide Content

Slide 1

Slide 2

Slide 3

Slide 4

Slide 5

Slide 6

Slide 7

Slide 8

Slide 9

Slide 10

Slide 11

Slide 12

Slide 13

Tags

Categories

Download

Quick Actions

Statistics

Related Slideshows

8-top-ai-courses-for-customer-support-representatives-in-2025.pptx

7-essential-ai-courses-for-call-center-supervisors-in-2025.pptx

25-essential-ai-courses-for-user-support-specialists-in-2025.pptx

8-essential-ai-courses-for-insurance-customer-service-representatives-in-2025.pptx

Know for Certain

PPT OPD LES 3ertt4t4tqqqe23e3e3rq2qq232.pptx