Môn học: Xử lý tín hiệu số nâng cao Lớp : M25CQKV01-B NHẬN DẠNG LÁ CÂY BỊ SÂU BỆNH Người thực hiện : Đoàn Đức Thắng - B25CHKV010 Hoàng Thành Long - B25CHKV008 Lê Đào Chung Thương - B25CHKV012
CHƯƠNG 1: TỔNG QUAN VỀ NÔNG NGHIỆP THÔNG MINH Khái quát về thực trạng nông nghiệp và các rủi ro sâu bệnh . Nông nghiệp thông minh và các giải pháp công nghệ được áp dụng Các vấn đề thách thức của công nghệ trong nông nghiệp thông minh
KHÁI QUÁT VỀ THỰC TRẠNG NÔNG NGHIỆP VÀ CÁC RỦI RO SÂU BỆNH Thiệt hại do sâu bệnh gây ra : suy giảm năng suất , giảm chất lượng nông sản , chi phí phát sinh . Khó khăn trong phát hiện sớm bằng phương pháp thủ công : dựa vào kinh nghiệm bằng mắt thường , chậm trễ trong phát hiện , thiếu chuyên môn kĩ thuật . Giải pháp công nghệ khắc phục thực trạng : Ứng dụng cảm biến IoT , Drone và hình ảnh đa phổ , p hần mềm AI chẩn đoán bệnh .
NÔNG NGHIỆP THÔNG MINH & CÁC GIẢI PHÁP CÔNG NGHỆ ĐƯỢC ÁP DỤNG Khái niệm nông nghiệp thông minh (Smart Agriculture): Là xu hướng ứng dụng công nghệ số (IoT, AI, Big Data) vào quản lý nông nghiệp để tối ưu hóa sản xuất, giảm rủi ro, và nâng cao hiệu quả. Các giải pháp công nghệ tiêu biểu : IoT (Internet of Things): cảm biến đất và drone. Trí tuệ nhân tạo (AI) và Học máy (Machine Learning): mô hình nhận diện hình ảnh và app di động . Hệ thống tự động : Robot phun thuốc theo vùng bệnh .
CÁC VẤN ĐỀ THÁCH THỨC CỦA CÔNG NGHỆ TRONG NÔNG NGHIỆP THÔNG MINH Thiếu dữ liệu huấn luyện chất lượng : Dữ liệu hình ảnh lá bệnh và Biến đổi môi trườn g. Hạn chế về hạ tầng công nghệ tại vùng nông thôn : Thiếu Internet và Thiết bị lạc hậu . Rào cản từ người dùng : Tâm lý ngại tiếp cận công nghệ của nông dân lớn tuổi và Chi phí đầu tư ban đầu cho công nghệ cao (drone, cảm biến, phần mềm) .
CHƯƠNG 2 CÁC MÔ HÌNH HỌC MÁY TRONG BÀI TOÁN CHẨN ĐOÁN SÂU BỆNH Tổng quan về học máy Các giải pháp ứng dụng học máy trong bài toán chẩn đoán sâu bệnh Lựa chọn giải pháp học máy cho chẩn đoán sâu bệnh trong IoT
TỔNG QUAN VỀ HỌC MÁY HỌC MÁY LÀ GÌ? Là một lĩnh vực con của Trí tuệ nhân tạ o AI Công nghệ cho phép máy móc học hỏi từ dữ liệu để đưa ra dự đoán hoặc quyết định mà không cần được lập trình một cách tường minh. Bắt chước hành vi thông minh của con người (nhận diện hình ảnh, hiểu ngôn ngữ, ra quyết định). PTIT
CÁC LOẠI HỌC MÁY HIỆN NAY 1. Học máy có giám sát (Supervised Machine Learning) 2. Học máy không giám sát (Unsupervised Machine Learning) 3. Học máy bán giám sát (Semi-supervised Learning) 4. Học máy tăng cường (Reinforcement Learning) PTIT Ví dụ về Học máy có giám sát
QUY TRÌNH HOẠT ĐỘNG CỦA HỌC MÁY PTIT Thu thập dữ liệu Bước 1 Bước 2 Tiền xử lý dữ liệu Bước 3 Phân tích dữ liệu Bước 4 Xây dựng Mô hình máy học Bước 5 Huấn luyện Mô hình Bước 6 Đánh giá Mô hình
THU THẬP DỮ LIỆU https://www.kaggle.com/datasets/emmarex/plantdisease PTIT Nguồn dữ liệu công khai : PlantVillage Dataset: Đây là bộ dữ liệu phổ biến . Nó chứa hàng chục nghìn ảnh lá cây khỏe mạnh và bệnh của nhiều loại cây , trong đó có cà chua .
TẬP DỮ LIỆU PLANTVILLAGE DATASET VỀ LÁ CÂY CÀ CHUA PTIT Có 10 danh mục trong đó có 9 loại bệnh và 1 khỏe mạnh : STT Danh mục Loại bệnh SL ảnh Đặc điểm nhận dạng chính của loại bệnh 1 Bacterial_Spot Đốm vi khuẩn 2127 Đốm nâu sẫm, ướt , viền vàng, thường ở rìa lá . 2 Early_Blight Mốc sương mai sớm 1000 Đốm tròn, vòng đồng tâm rõ như "mắt bò", có quầng vàng . 3 Late_Blight Mốc sương mai muộn 1909 Vết bệnh lớn, lan nhanh , màu nâu đen. Mặt dưới có mốc trắng khi ẩm. 4 Leaf_Mold Bệnh mốc lá 952 Mặt trên vàng , mặt dưới phủ mốc xanh/nâu như nhung. 5 Septoria_Leaf_Spot Đốm lá Septoria 1771 Vô số đốm nâu nhỏ li ti , viền sẫm, có chấm đen ở giữa. 6 Spider_Mites Bệnh nhện đỏ 1676 Lá khô, giòn, có màng tơ , màu vàng đồng . Nhìn kỹ thấy con nhện . 7 Target_Spot Bệnh Đ ốm vòng 1404 Đốm tròn, vòng đồng tâm mờ hơn Early Blight, giống "bia ngắm". 8 Yellow Leaf_Curt_Virus Vi rút xoăn vàng lá 3209 Lá vàng, xoăn tít lại , còi cọc , teo nhỏ. 9 Mosaic_Virus Vi rút khảm lá 373 Lá loang lổ màu xanh-vàng , nhăn nheo , biến dạng. 10 Tomato_Healthy Lá khỏe mạnh 1591
PHÂN BIỆT 9 LOẠI BỆNH TRÊN LÁ CÂY CÀ CHUA PTIT Đốm Vi Khuẩn (Bacterial Spot): Đốm nâu sẫm , viền vàng Mốc sương mai sớm ( Early_Blight ): Đốm tròn, vòng đồng tâm , quầng vàng Mốc sương mai muộn ( Late_Blight ): Vết bệnh lớn, lan nhanh, màu nâu đen. Mặt dưới có mốc trắng
PHÂN BIỆT 9 LOẠI BỆNH TRÊN LÁ CÂY CÀ CHUA PTIT Bệnh mốc lá ( Leaf_Mold ): Mặt trên vàng, mặt dưới phủ mốc xanh/nâu như nhung Đốm lá Septoria ( Septoria_Leaf_Spot ): Vô số đốm nâu nhỏ li ti, viền sẫm, có chấm đen ở giữa. Bệnh nhện đỏ ( Spider_Mites ): Lá khô, giòn, có màng tơ, màu vàng đồng. Nhìn kỹ thấy con nhện
PHÂN BIỆT 9 LOẠI BỆNH TRÊN LÁ CÂY CÀ CHUA PTIT Bệnh Đ ốm vòng ( Target_Spot ): Đốm tròn, vòng đồng tâm mờ hơn Early Blight Vi rút xoăn vàng lá (Yellow Leaf_Curt_Virus ): Lá vàng, xoăn tít lại, còi cọc, teo nhỏ Vi rút khảm lá ( Mosaic_Virus ): Lá loang lổ màu xanh-vàng, nhăn nheo, biến dạng
TIỀN XỬ LÝ DỮ LIỆU PTIT 1. Chuẩn hóa kích thước ảnh . 2. Chuẩn hóa giá trị pixel. 3. Tăng cường dữ liệu .
TIỀN XỬ LÝ DỮ LIỆU PTIT Chuẩn hóa kích thước ảnh : Tất cả ảnh đầu vào phải có cùng kích thước . Đây là đầu vào bắt buộc cho các mô hình CNN. (Convolutional Neural Network - mạng nơ ron tích chập ).
TIỀN XỬ LÝ DỮ LIỆU PTIT Chuẩn hóa giá trị pixel: Chuyển giá trị pixel từ [0, 255] về khoảng [0, 1] hoặc [-1, 1] để giúp mô hình hội tụ nhanh hơn . pixel_values = pixel_values / 255.0
TIỀN XỬ LÝ DỮ LIỆU PTIT Tăng cường dữ liệu : Chỉ áp dụng cho dữ liệu training set. Kỹ thuật cực kỳ quan trọng khi dữ liệu ít . Nó tạo ra các biến thể mới từ ảnh gốc mà không làm thay đổi nhãn . Xoay ngẫu nhiên (Rotation) Lật ngang / lật dọc (Horizontal/Vertical Flip) Dịch chuyển (Shift) Phóng to thu nhỏ (Zoom).
Ví dụ về tăng cường dữ liệu PTIT Phản chiếu trên trục dọc Cắt xén ngẫu nhiên Xoay 20 độ tại góc trên bên trái Xoay 20 độ tại góc dưới bên phải …
XÂY DỰNG MÔ HÌNH PTIT Mục tiêu : Xây dựng mô hình tối ưu số lượng tham số , kích thước nhẹ phù hợp triển khai trên các thiết bị có tài nguyên tính toán hạn chế mà vẫn đảm bảo được độ chính xác của mô hình . Từ đó có thể triển khai diện rộng trên các thiết bị IoT.
MẠNG NEURON TÍCH CHẬP PTIT Mạng CNN hoạt động dựa trên các phép tính tích chập thông qua các bộ lọc để trích xuất thông tin từ ảnh Phù hợp với dữ liệu dạng ảnh , do ảnh có cấu trúc không gian đa chiều
PHÉP TÍNH TÍCH CHẬP TRÊN 1 KÊNH PTIT
PHÉP TÍCH CHẬP TRÊN 3 KÊNH PTIT
TÍCH CHẬP THEO CHIỀU SÂU PTIT
CHI PHÍ TÍNH TOÁN PTIT 🟦 Tích chập chuẩn (Standard Conv) cost = Hout × Wout × Cout × (K * K × Cin) Params = Cout × K * K × Cin 🟩 Tích chập theo chiều sâu ( Depthwise Separable Conv) Depthwise : cost = Hout × Wout × (Cin × K * K ), Params = Cin * K * K Pointwise: cost = Hout × Wout × (Cin × Cout), Params = Cin × Cout Tổng : cost = Hout × Wout × (Cin*K*K + Cin*Cout) Params = (Cin * K * K + Cin * Cout) Trong đó : Cin là số kênh vào , Cout là số kênh ra Hout là chiều cao của ảnh đầu ra , Wout là chiều rộng ảnh đầu ra K là kích thước bộ lọc
BATCH NORMALIZE LAYER PTIT
BATCH NORMALIZE LAYER PTIT For each channel c: Mean: μ_ c = (1 / N·H·W) · Σ x[ n,c,i,j ] Variance: σ²_ c = (1 / N·H·W) · Σ ( x[ n,c,i,j ] - μ_ c)² Normalize: x̂[ n,c,i,j ] = (x[ n,c,i,j ] - μ_ c) / sqrt( σ²_ c + ε) Scale & Shift: y[ n,c,i,j ] = γ_ c · x̂[ n,c,i,j ] + β_ c