Materi Data Science - Pertemuan 3 Data Preprocessing & Exploratory Data Analysis (EDA)
Pengantar - Review pertemuan sebelumnya: dasar Python & pengenalan data science - Fokus: persiapan data & eksplorasi pola sebelum analisis lebih lanjut
Data Preprocessing Tujuan: membersihkan & menyiapkan data - Handling Missing Values - Handling Outliers - Data Transformation (Normalisasi, Standarisasi, Encoding)
Handling Missing Values - Hapus baris/kolom kosong - Isi dengan mean, median, modus - Gunakan metode interpolasi
Handling Outliers - Deteksi dengan boxplot atau z-score - Buang data outlier - Transformasi nilai (misal log transform)
Exploratory Data Analysis (EDA) - Analisis statistik deskriptif - Visualisasi data (Histogram, Boxplot, Scatterplot, Heatmap) - Analisis korelasi antar variabel
Studi Kasus (Python) - Dataset contoh: Iris / Titanic - Load data dengan pandas - Cek missing values (df.isnull().sum()) - Isi missing values dengan fillna() - Visualisasi dengan matplotlib/seaborn
Tugas Pertemuan 1. Ambil dataset sederhana (contoh: Titanic dari seaborn) 2. Lakukan preprocessing: - Tangani missing values - Tangani minimal 1 outlier - Buat 2 visualisasi untuk EDA 3. Laporkan hasil dalam Jupyter Notebook