Slide Presentasi Klasifikasi dan Pengenalan Pola.pptx
riko58
0 views
11 slides
Oct 10, 2025
Slide 1 of 11
1
2
3
4
5
6
7
8
9
10
11
About This Presentation
Berikut ini adalah materi ajar mata kuliah klasifikasi dan pengenalan pola
Size: 79.2 KB
Language: none
Added: Oct 10, 2025
Slides: 11 pages
Slide Content
KLASIFIKASI DANPENGENALAN POLA Dosen : Februariko Y. Selan, S.Pd., M.Pd
1. Apa itu pengenalan pola? Pengenalan pola adalah proses mengidentifikasi pola atau struktur dari data yang kita punya, lalu mengelompokkan atau mengklasifikasikannya berdasarkan pola tersebut Contoh sehari-hari: - Mengenali wajah teman di foto. - Email yang otomatis diklasifikasikan sebagai spam atau bukan spam. - Aplikasi kamera yang bisa mengenali objek (misalnya "ini anjing", "ini mobil").
Tujuan utama: Mengembangkan sistem otomatis yang bisa: Menerima data (gambar, suara, teks, dll). Mengenali pola dari data tersebut. Mengambil keputusan atau membuat klasifikasi.
Beberapa istilah penting: Fitur (feature) : Informasi penting dari data, seperti warna, bentuk, atau panjang suatu objek. Kelas (class) : Kategori hasil klasifikasi, misalnya: spam vs tidak spam. Label : Penanda kelas pada data latih, digunakan saat melatih model. Data latih (training data) : Data yang sudah dilabeli, digunakan untuk melatih sistem. Data uji (testing data) : Data yang digunakan untuk menguji apakah sistem sudah bisa mengenali pola dengan baik.
2. Representasi Data & Ekstraksi Fitur Representasi Data Sistem komputer tidak bisa langsung "melihat" seperti manusia. Jadi, semua data (gambar, suara, teks) perlu diubah menjadi angka, biasanya dalam bentuk vektor fitur . Contoh: Gambar: diubah jadi angka-angka berdasarkan warna tiap piksel. Teks: diubah jadi angka berdasarkan frekuensi kata. Suara: diubah jadi gelombang digital, lalu angka.
Apa itu fitur? Fitur adalah informasi penting yang kita ambil dari data untuk membantu proses klasifikasi. Misalnya, untuk mengenali buah: Fitur = warna, ukuran, berat, tekstur kulit. Ekstraksi Fitur Proses mengambil fitur-fitur penting dari data mentah . Tujuannya agar sistem bisa fokus pada hal-hal yang relevan saja. Metode umum: PCA (Principal Component Analysis) : Menyederhanakan data dengan memilih fitur paling berpengaruh. LDA (Linear Discriminant Analysis) : Membedakan data dari kelas berbeda dengan maksimal. Untuk gambar: bisa pakai SIFT , HOG , dll (dipakai di pengolahan citra komputer).
3. Teknik Pra-Pemrosesan Data Sebelum data dipakai untuk melatih model, biasanya perlu diproses dulu supaya: Lebih bersih Lebih seragam Lebih mudah dipahami oleh model
Langkah-langkah umum pra-pemrosesan: 1. Pembersihan Data Menghapus/mengisi data yang hilang (missing values). Mengatasi outlier (data yang terlalu ekstrem dan tidak wajar). Menghapus data duplikat.
2. Normalisasi dan Standarisasi Supaya semua fitur punya skala yang seimbang. Normalisasi : mengubah nilai ke rentang 0 sampai 1. Standarisasi : membuat rata-rata jadi 0 dan standar deviasi jadi 1. Contoh: Jika satu fitur berupa umur (0–100) dan yang lain berat badan (30–200), skalanya berbeda dan bisa menyesatkan model.
3. Encoding Data Kategorikal Untuk data yang berbentuk teks atau kategori, seperti: "Laki-laki", "Perempuan" → perlu diubah jadi angka. Bisa pakai One-Hot Encoding , Label Encoding . 4. Augmentasi Data (Data Augmentation) Menambah variasi data secara buatan. Contoh: memutar atau membalik gambar agar model jadi lebih kuat dan tidak mudah overfitting.