DATA MINING-EDA dan Visualisasi Data-Pertemuan Tiga

YesyAfrilliaSTMKom19 5 views 17 slides Sep 09, 2025
Slide 1
Slide 1 of 17
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10
Slide 11
11
Slide 12
12
Slide 13
13
Slide 14
14
Slide 15
15
Slide 16
16
Slide 17
17

About This Presentation

Data Mining


Slide Content

DATA MINING PART-03 Exploratory Data Analysis (EDA) & Visualisasi Data dalam Data Mining [email protected]

Pengertian Exploratory Data Analysis (EDA) EDA adalah proses analisis awal data untuk memahami pola , mendeteksi anomali , menemukan hubungan antar variabel , dan mendapatkan wawasan yang berguna sebelum menerapkan algoritma data mining . Mahasiswa mampu melakukan eksplorasi awal terhadap dataset dengan menggunakan statistik deskriptif , memahami distribusi data, mengukur hubungan antar variabel , serta membuat visualisasi dasar seperti histogram, scatter plot, dan boxplot. Tujuan EDA: ✅ Memahami karakteristik dataset ( jumlah data, jenis fitur , distribusi ) ✅ Mengidentifikasi data yang hilang (missing values) atau tidak valid ✅ Mendeteksi outlier (data ekstrem yang tidak biasa ) ✅ Mengetahui korelasi antar variabel ✅ Menyajikan data dalam bentuk visual agar lebih mudah dipahami

Statistik Deskriptif Statistik deskriptif adalah metode untuk : Menggambarkan atau meringkas data, Melalui angka dan visualisasi , Tanpa membuat kesimpulan ( inferensi ) terhadap populasi . Statistik deskriptif digunakan untuk eksplorasi awal dalam proses data preprocessing dan data understanding .

Komponen Statistik Deskriptif A. Ukuran Pemusatan (Central Tendency) Menggambarkan " titik pusat " atau representasi nilai umum dari data.

Visualisasi dalam Statistik Deskriptif

Studi Kasus: Analisis Penjualan Toko Online Konteks Kasus : Seorang analis data diminta untuk melakukan analisis statistik deskriptif terhadap data penjualan 10 produk yang terjual dalam sebulan di toko online. Data jumlah produk terjual per minggu selama 4 minggu adalah sebagai berikut : Minggu 1: 45, 50, 52, 47, 55 Minggu 2: 60, 65, 62, 58, 61 Minggu 3: 70, 75, 72, 68, 74 Minggu 4: 80, 85, 82, 78, 84 Dari data tersebut , analis diminta untuk : Menghitung ukuran pemusatan (mean, median, dan modus). Menghitung ukuran penyebaran (range, variansi , dan standar deviasi ). Menghitung interquartile range (IQR). Menganalisis hasil yang diperoleh untuk membuat rekomendasi tentang strategi penjualan .

Buatkan Penyelesaiannya : Tulis Tangan Tugas-04

TERIMAKASIH ..SELESAI..
Tags