05 – Data Wrangling
YOGI SAPUTRA
30/09/2025 201004-705-01-065 - Data Science - Informatics UIN SGD
Bandung
1
Data Wrangling/Data
Preparation
Decision Making
Apa itu Data Wrangling?
Data wrangling adalah proses sistematis mengumpulkan,
memilih, dan mengubah data mentah ke dalam format yang
terstruktur dan siap analisis. Proses ini dikenal juga sebagai
pembersihan data - fondasi penting yang memungkinkan bisnis
menangani data kompleks dengan lebih efisien dan akurat.
Metode yang digunakan bervariasi tergantung karakteristik data
dan tujuan proyek yang ingin dicapai.
Perbedaan Data Wrangling vs. Data Cleaning
Data Wrangling
Data wrangling adalah proses yang lebih
luas yang mencakup data cleaning serta
pengumpulan, transformasi, dan
persiapan data untuk analisis lebih lanjut.
Data Cleaning
Data cleaning adalah bagian dari proses
data wrangling yang fokus pada
identifikasi dan perbaikan masalah dalam
data, seperti kesalahan pengetikan, data
yang hilang, atau duplikat.
Mengapa Data Wrangling Penting?
Transformasi Chaos
Mengubah data berantakan menjadi
format yang mudah dipahami dan
siap digunakan untuk analisis
mendalam
Akurasi Maksimal
Meminimalkan kesalahan akibat
inkonsistensi format dan
meningkatkan reliabilitas hasil
analisis
Efisiensi Waktu
Memungkinkan analis fokus pada
interpretasi data daripada
menghabiskan waktu untuk
pembersihan manual
5 Manfaat Utama Data Wrangling
01
Analisis Sederhana
Memungkinkan analis bisnis memeriksa
data kompleks dengan cepat dan efektif
setelah data mentah dijinakkan
02
Penanganan Data
Mengubah data mentah dari berbagai
sumber menjadi format terstruktur dan
memperkaya data untuk pemahaman
lebih dalam
03
Peningkatan Penargetan
Menggabungkan data multi-sumber
untuk memahami audiens dan
meningkatkan strategi kampanye
04
Optimalisasi Waktu
Mengurangi waktu pengelolaan data tidak teratur dan
meningkatkan waktu untuk menghasilkan insight berharga
05
Visualisasi Data
Mempersiapkan data untuk ekspor ke platform analitik visual
seperti Python untuk presentasi informasi yang efektif
6 Tahapan Implementasi Data Wrangling
Discovery
Eksplorasi mendalam untuk
mengidentifikasi tren, pola, dan
karakteristik data
Structuring
Mengatur data dari berbagai sumber
dengan format yang koheren dan siap
analisis
Cleaning
Menghapus duplikasi, memperbaiki
nilai hilang, dan standardisasi data
Enriching
Memperkaya data dengan informasi
tambahan untuk analisis komprehensif
Validating
Memastikan kualitas, konsistensi, dan
reliabilitas data yang diolah
Publishing
Menyiapkan data final dalam format
yang siap untuk analisis dan
keputusan
4 Contoh Praktis Data Wrangling
Menghapus Data Tidak Relevan
Mengidentifikasi dan mengeliminasi data yang tidak berkontribusi pada analisis,
mencegah noise yang dapat mengganggu hasil
Menangani Data Hilang
Menggunakan metode statistik seperti rata-rata, median, atau teknik interpolasi
untuk mengisi missing values
Menggabungkan Multi-Sumber
Menyatukan data dari berbagai database dan sistem menjadi satu dataset kohesif
yang siap analisis
Filtering Berdasarkan Kriteria
Menerapkan filter spesifik untuk fokus pada subset data yang relevan dengan
tujuan analisis
Dampak Data Wrangling pada Bisnis
80%
Waktu Analisis
Berkurangnya waktu yang dibutuhkan
untuk persiapan data, memungkinkan
fokus pada insight
60%
Akurasi Keputusan
Peningkatan akurasi dalam
pengambilan keputusan bisnis
berdasarkan data berkualitas tinggi
3x
Efisiensi Tim
Peningkatan produktivitas tim analitik
dengan data yang sudah terstruktur
dengan baik
Kesimpulan: Investasi yang
Menguntungkan
Fondasi Analisis
Data wrangling adalah fondasi
penting untuk setiap proyek
data science yang sukses
Skill Wajib
Setiap data scientist harus
menguasai teknik
pembersihan dan preparasi
data
ROI Tinggi
Kualitas analisis dan keputusan bisnis bergantung sepenuhnya pada
kualitas data yang disiapkan melalui proses data wrangling yang
teliti.