Analítica de datos para toma de decisiones

felipebermudez30 7 views 10 slides Oct 17, 2025
Slide 1
Slide 1 of 10
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10

About This Presentation

Analítica de datos para toma de decisiones


Slide Content

T2 TAREA_2 Presentado por: FELIPE ANTONIO BERMÚDEZ GIRALDO INGENIERO DE SISTEMAS Y TELECOMUNICACIONES Fecha de entrega: 06/04/2025

Prerrequisitos MÍNIMOS NECESARIOS SU EQUIPO DE CÓMPUTO

Objetivos específicos

Objetivo 1: Analizar un conjunto de datos con problemas de calidad (por ejemplo valores faltantes o inconsistencias) y discutir cómo estos problemas afectan los resultados del análisis. La calidad de los datos es un factor crítico en cualquier proyecto de analítica. Problemas como valores faltantes, datos inconsistentes, duplicados y valores atípicos ( outliers ) pueden distorsionar los análisis, afectar la precisión de los modelos predictivos y conducir a decisiones empresariales erróneas. En el análisis del caso (empresa de telecomunicaciones), se identificaron varios de estos problemas, lo cual resaltó la importancia de realizar una limpieza y validación adecuada antes de cualquier modelado. Ignorar estos errores puede llevar a campañas de retención ineficientes, segmentación incorrecta de clientes o pérdida de recursos.

Objetivo 2: Presentar un caso donde la mala calidad de los datos afectó una decisión empresarial clave (por ejemplo, una predicción errónea debido a datos imprecisos o incompletos. En el modelo predictivo del proyecto, si no se hubiesen limpiado adecuadamente los datos (como inconsistencias en ingresos o duplicados de clientes), se podrían haber tomado decisiones erróneas sobre campañas de retención. Ejemplo realista: Una empresa lanzó una promoción a los "clientes con ingresos bajos", pero como había valores negativos o faltantes en la columna de ingresos, terminó incluyendo clientes erróneos en la campaña. Resultado: la tasa de respuesta fue muy baja y se desperdició presupuesto. Este tipo de errores se pueden evitar con una buena limpieza y validación de datos.

Objetivo 3: Los estudiantes deben trabajar con un conjunto de datos real o simulado que contenga errores comunes (valores faltantes, outliers , duplicados) y realizar un proceso básico de limpieza. Se crean diferentes visualizaciones para ver la distribución de los datos y ver la relación entre las variables, graficas como boxplot , histogramas y matrices de correlación Pasos:

Objetivo 3: Los estudiantes deben trabajar con un conjunto de datos real o simulado que contenga errores comunes (valores faltantes, outliers , duplicados) y realizar un proceso básico de limpieza. Pasos: El modelo es excelente identificando a los clientes que realmente hacen churn (99.7% de recall ). El problema es que clasifica erróneamente a muchos clientes como churn cuando realmente no lo hacen (55% de precisión en churn ). Tiene una baja capacidad para identificar clientes que se quedan, ya que de 3464 clientes que no hacen churn , solo 584 fueron correctamente clasificados.

Dificultades y Soluciones

Recursos utilizados

Conclusiones
Tags