Delimitación de áreas quemadas por incendios forestales mediante Aprendizaje Profundo en imagenes satelitales
Deep Learning Redes Neuronales Artificiales Fuente: https://www.ackstorm.com/deep-learning-clasificacion-imagenes/ Fuente: https://es.wikipedia.org/wiki/Perceptron Perceptrón
Segmentación semántica Fuente: Deep Learning for Computer Vision , 2018, Shanmugamani . Imagen y su segmentación semántica Arquitectura Modelo Fuente: Aprendizaje Profundo, 2021, Pajares. Fuente: Deep Learning for Computer Vision , 2018, Shanmugamani . Métricas de validación Exactitud - Accuracy = (VP + VN) / (VP + FP + FN + VN) Precisión - Precision (P) = (VP) / (VP + FP) Sensibilidad - Recall (R) = (VP) / (VP + FN) F-score - F1 = (2PR)/(P + R) IoU o Índice de Jaccard Índice de Kappa
MARCO METODOLÓGICO Preprocesamiento de Datos Bandas utilizadas en Apilamiento Cicatrices RIF – 2017 al 2021 : Cusco Flujo de preprocesamiento
MARCO METODOLÓGICO Conjunto de Datos Escenas – Sentinel-2 Tiles para aprendizaje supervisado Combinación de bandas Sentinel-2
MARCO METODOLÓGICO Conjunto de Datos Datos: Grupo 1 – G1: proporción de tiles con máscaras: 15.3 % Datos: Grupo 2 – G2: proporción de tiles con máscaras: 20 % Datos: Grupo 3 – G3: proporción de tiles con máscaras: 25 % Finalmente, se tienen 18 conjuntos de datos, y de cada uno de ellos evaluaremos sus métricas y resultados La columna TIT nos indica el número de tiles totales. La columna TSE nos menciona el número de tiles sin etiqueta, que son aquellos libres de área quemada - ecosistemas. La columna TCE nos indica el número de tiles con etiqueta - máscaras (aquellas que contienen píxeles de área quemada pero no necesariamente todo el tile). TIT = TSE + TCE.
MARCO METODOLÓGICO Flujo de generación del modelo de Segmentación Flujo de entrenamiento, validación y prueba
MARCO METODOLÓGICO Flujo de generación del modelo de Segmentación Arquitectura del modelo UNet propuesto Los hiperparámetros asociados al modelo permanecerán siendo los mismos: batch size , número de épocas, método de optimización, función de pérdida, y métrica de validación Los parámetros propios del modelo (Pesos de los filtros) son obtenidos en la fase de entrenamiento y contrastados en la fase de validación Para la fase de pruebas, el modelo no tuvo acceso a los Datos de Prueba El Grupo G3 utilizará técnica de Aumento de Datos (Data Augmentation ) para comparar resultados con G1 y G2
Arquitectura del modelo Attention-UNet Arquitectura del modelo HRNet
RESULTADOS Métricas: Grupo G1 – D1 al D6 Matriz de Confusión: G1 - D1 y D2 Matriz de Confusión: G1 – D3 y D4 Matriz de Confusión: G1 – D5 y D6
Métricas: Grupo G2 – D1 al D6 Matriz de Confusión: G2 - D1 y D2 Matriz de Confusión: G2 – D3 y D4 Matriz de Confusión: G2 – D5 y D6 RESULTADOS
Métricas: Grupo G3 – D1 al D6 (AD: Aumento de datos) Matriz de Confusión: G3 RESULTADOS
Matriz de Confusión: G3 RESULTADOS
Métrica: F1-Score - Grupo G1 Métrica: F1-Score - Grupo G3 Métrica: F1-Score - Grupo G2 RESULTADOS
Métrica: Jaccard ( IoU ) - Grupo G3 Métrica: Jaccard ( IoU ) - Grupo G2 Métrica: Jaccard ( IoU ) - Grupo G1 RESULTADOS
RESULTADOS – COMPARACIÓN VISUAL Comparación visual – Grupo G1
Comparación visual – Grupo G2 RESULTADOS – COMPARACIÓN VISUAL
Comparación visual – Grupo G3 RESULTADOS – COMPARACIÓN VISUAL
Métrica Valor Interpretación en segmentación de píxeles quemados Coef . Jaccard ( IoU ) 0.8474 El modelo superpone bien las áreas quemadas con las etiquetas verdaderas. Hay cierto error, pero la segmentación es bastante precisa. Precisión (Precision) 0.9091 El 90.91% de los píxeles clasificados como quemados son realmente quemados. Es decir, el modelo comete pocos falsos positivos (FP). Recall (Exhaustividad) 0.9258 El 92.58% de los píxeles quemados reales fueron detectados por el modelo. Un recall alto indica que el modelo tiene pocos falsos negativos (FN). F1-Score 0.9174 Balance entre Precisión y Recall . Un F1 alto indica que el modelo detecta bien sin exagerar ni omitir muchas áreas quemadas. Coef. Kappa 0.9141 Indica un alto grado de acuerdo entre el modelo y las etiquetas verdaderas, considerando el azar. UNet AttentionUNet AttentionUNet - DA HRNet D1-G1 D1-G2 D1-G3 D1-G1 D1-G2 D1-G3 D1-G1 D1-G2 D1-G3 D1-G1 D1-G2 D1-G3 Predicción - Test - Metricas Coef Jaccard - IoU 0.8474 0.838 0.8355 0.862 0.8344 0.8631 0.7851 0.8466 0.8801 0.8732 0.867 0.8146 Precision 0.9091 0.9113 0.9307 0.9272 0.9081 0.9306 0.8584 0.92 0.9319 0.9173 0.905 0.8841 Recall - Exhaustividad 0.9258 0.9124 0.891 0.9247 0.9114 0.9225 0.9019 0.9138 0.9405 0.9478 0.9538 0.912 F1-Score 0.9174 0.9119 0.9104 0.926 0.9097 0.9265 0.8796 0.917 0.9362 0.9323 0.9287 0.8978 Coef Kappa 0.9141 0.9073 0.9046 0.923 0.905 0.9217 0.8748 0.9126 0.932 0.9296 0.925 0.891
RESULTADOS – PREDICCION La inferencia o predicción se ha realizado sobre Tiles completos de Sentinel-2 de los años: 2018, 2020, 2021 (años de las muestras de entrenamiento), pero también de 2023 y 2024. Los tiles predichos principalmente son de la región Cusco, pero también a modo de pruebas se infirieron de las regiones de: Amazonas, Arequipa y Apurímac. Los resultados se han compartido a los profesionales de la UFMS para su evaluación respectiva. Los resultados inferidos no son necesariamente los finales, normalmente la salida de los modelos predictivos forman parte de un flujograma mayor.
TRABAJOS SIGUIENTES POR DEFINIR Generación de script de automatización de áreas quemadas en formato: Vectorial y Raster, por Tile de Sentinel-2 por regiones definiendo un modelo de los propuestos anteriormente. (DEMAQ v1.0) Reentrenamiento de modelo de ítem anterior con datos de cicatrices 2022, 2023 y 2024. Generación de script DEMAQ v1.1 Adición (Fusión) de imágenes RADAR en datos de entrenamiento (ópticos) para obtener script DEMAQ v1.2 Los modelos anteriores están basados en CNN – Redes Neuronales Convolucionales . Funciona bien en áreas homogéneas. Mejora utilizando un modelo en base a Transformers (ópticas y/o radar) – DEMAQ v1.3. Captura patrones más complejos y fragmentados. Mejora utilizando un modelo híbrido: CNN + Transformes – DEMAQ v1.4. Aúna las fortalezas de ambos.
TRABAJOS SIGUIENTES POR DEFINIR Mejora utilizando los denominados : Modelos Fundacionales – estado del arte Prithvi-100M-burn-scar Prithvi-100M-burn-scar
Ejemplos – Tema de Incendios Forestales URL: https://huggingface.co/ibm-nasa-geospatial/ Prithvi-EO-1.0-100M-burn-scar URL: https://huggingface.co/spaces/ibm-nasa-geospatial/ Prithvi-100M-Burn-scars-demo URL: https://www.arcgis.com/home/item.html?id=9af7af28dd91473bbc8ad40942e74563 URL: https://doc.arcgis.com/en/pretrained-models/latest/imagery/introduction-to-prithvi-burn-scars-segmentation.htm