Diplomado de soluciones digitales
avanzadas en la nube
Intermedio 1.
Módulo: Machine Learningcon Python
Profesor Jaime A. Riascos Salas
2021
Jaime A. Riascos Salas
Mg. Ciencias Computacionales
UFRGS –Brasil
Ing. Mecatrónico
ITM –Colombia
Data Scientist @ MINTIC (CO) & UpSensor(BR)
Lead Researcher@ IUE (CO)
Unmodeloderegresiónesunmodeloquepermitedescribircómoinfluye
una variable X sobre otra variable Y.
•X: Variable independienteo explicativa o exógena
•Y: Variable dependienteo respuesta o endógena
El objetivo es obtener estimaciones razonables de Y para distintos valores
deXapartirdeunamuestradenparesdevalores(x1,y1),...,(xn,yn).
Aprendizaje supervisado -
Regresión
Aprendizaje supervisado –
Regresión lineal múltiple
Lasventasregionalesydelproductodeunacompañía
podríanestarrelacionadascontresfactores:
x
1:lacantidadgastadaenpublicidadentelevisión.
x
2:lacantidadgastadaenpublicidadenperiódicos.
x
3:elnúmerodevendedoresasignadosalaregión.
Aprendizaje supervisado –
Forecasting–Series de tiempo
Obtenido al observarla variable de respuestaenun tiemporegular
Periodos
• Conjunto de datosnuméricosespaciadosuniformemente
• Pronósticobasadosolo envalorespasados
• Asumeque los factoresque influyenenelpasadoy elpresentecontinuarán
influenciaenelfuturo
Aprendizaje supervisado –
Forecasting–Series de tiempo
Aprendizaje supervisado –
Forecasting–Series de tiempo
El pronosticador busca patrones de datos como
Datos = patrón histórico + variación aleatoria
Patrón histórico a pronosticar:
•Nivel (promedio a largo plazo): los datos fluctúan alrededor de una media
constante
•Tendencia: los datos muestran un patrón creciente o decreciente
•Estacionalidad: cualquier patrón que se repite regularmente y tiene una duración
constante.
•Ciclo: patrones creados por fluctuaciones económicas
No se puede predecir la variación aleatoria
Aprendizaje supervisado –
Forecasting–Series de tiempo
Aprendizaje supervisado –
Forecasting
Aprendizaje supervisado –
Forecasting
Aprendizaje supervisado –
Forecasting
Naive
•El pronóstico es igual al valor real observado durante el último período -bueno
para patrones de nivel
Media simple
•El promedio de todos los datos disponibles: bueno para patrones de nivel
Media móvil
•El valor promedio durante un período de tiempo establecido (por ejemplo: las
últimas cuatro semanas)
•Cada nuevo pronóstico elimina el punto de datos más antiguo y agrega una nueva
observación
•Más receptivo a una tendencia, pero aún está por detrás de los datos realesn/AF
t1t=
+ n/AF
t1t=
+ tA=
+1t
F
Aprendizaje supervisado –
Forecasting
Media móvil ponderada:
•Todos los pesos deben sumar 100% o 1,00
p.ej. Ct.5, Ct-1 .3, Ct-2 .2 (los pesos se suman a 1.0)
•Permite enfatizar un período sobre otros; arriba indica más peso en los datos
recientes (Ct= .5)
•Se diferencia del promedio móvil simple que pesa todos los períodos por igual: más
sensible a las tendencias=
+ tt1t ACF
Aprendizaje supervisado –
Forecasting
Suavizado exponencial:
El método de series de tiempo más utilizado debido a la facilidad de uso y la cantidad
mínima de datos necesarios. Solo se necesitan tres datos para comenzar:
•Previsión del último período (pies)
•Valor real de los últimos períodos (At)
•Seleccione el valor del coeficiente de suavizado, entre 0 y 1,0
Si no hay un pronóstico del último período disponible, promedie los últimos períodos
o utilice un método naive.
Los valores más altos (por ejemplo, .7 o .8) pueden asignar demasiado peso a la
variación aleatoria del último período.()
tt1t
Fα1αAF −+=
+