Pertemuan ke dua Analisa Big Data (EKSTRAKSI DATA .pptx)

FebriSugandi1 0 views 10 slides Oct 06, 2025
Slide 1
Slide 1 of 10
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10

About This Presentation

EKSTRAKSI DATA


Slide Content

EKSTRAKSI DATA Febri Sugandi,S.T.,M.T.i

Pendahuluan ekstraksi data Ekstraksi data adalah proses pengumpulan atau pengambilan data dari berbagai sumber, baik yang terstruktur maupun tidak terstruktur. Proses ini sangat penting untuk mengonsolidasikan, memproses, dan memperhalus data sehingga dapat disimpan di lokasi terpusat untuk analisis atau transformasi lebih lanjut. Ekstraksi data merupakan langkah pertama dalam proses ETL (extract, transform, load) dan ELT (extract, load, transform), yang merupakan bagian dari strategi integrasi data yang lengkap.

Jenis-jenis data yang diekstrak 1. Data terstruktur Data terstruktur memiliki format yang jelas dan teratur, seperti database relasional (MySQL, PostgreSQL) atau spreadsheet (Excel). Contoh data terstruktur meliputi: Data transaksi:  Data penjualan, pembelian, pembayaran, dan lainnya. Data pelanggan:  Informasi demografis, riwayat pembelian, preferensi. Data produk:  Informasi produk, harga, stok.

2. Data tidak terstruktur Data tidak terstruktur tidak memiliki format yang tetap dan seringkali berupa teks, gambar, audio, atau video. Contoh data tidak terstruktur meliputi: Teks:  Email, dokumen, ulasan pelanggan, posting media sosial. Gambar:  Foto produk, logo, grafik. Audio:  Rekaman panggilan, podcast. Video:  Rekaman pertemuan, iklan.

Proses ekstraksi data Secara umum, proses ekstraksi data dapat dibagi menjadi beberapa tahap: Identifikasi sumber data: Menentukan dari mana data akan diambil. Perencanaan ekstraksi: Menentukan data apa yang akan diekstrak, format data, dan tujuan ekstraksi. Pengembangan skrip atau query: Membuat skrip atau query untuk mengekstrak data. Ekstraksi data: Melakukan proses ekstraksi data sesuai dengan skrip atau query yang telah dibuat. Pembersihan data: Memeriksa dan membersihkan data dari kesalahan, inkonsistensi, atau nilai yang hilang. Transformasi data: Mengubah format data agar sesuai dengan kebutuhan analisis. Pemuatan Data: Memuat data yang sudah bersih dan tertransformasi ke dalam sistem target .

Manfaat ekstraksi data Ekstraksi data menawarkan banyak manfaat bagi bisnis, di antaranya: Pengambilan keputusan yang lebih baik:  Data yang akurat dan terkini dapat membantu dalam membuat keputusan bisnis yang lebih baik. Peningkatan efisiensi:  Otomatisasi proses ekstraksi data dapat menghemat waktu dan tenaga. Analisis data yang lebih mendalam:  Ekstraksi data memungkinkan kita untuk melakukan analisis data yang lebih kompleks, seperti analisis prediktif dan analisis sentimen. Personalisasi:  Data pelanggan yang diekstrak dapat digunakan untuk memberikan pengalaman pelanggan yang lebih personal. Inovasi:  Data dapat menjadi sumber inspirasi untuk pengembangan produk dan layanan baru.

Contoh ekstrasi data 1. Pengelolaan arsip faktur penjualan Perusahaan dengan volume penjualan yang tinggi menghasilkan banyak sekali faktur penjualan. Mengelola arsip faktur secara manual sangatlah tidak efisien dan berpotensi kehilangan dokumen penting. Dengan menerapkan OCR, perusahaan dapat memindai faktur penjualan dan mengekstrak data seperti nomor faktur, tanggal faktur, nama pelanggan, dan total penjualan. Data ini kemudian dapat disimpan dalam sebuah database yang terorganisir, sehingga memudahkan pencarian dan analisis data penjualan.

2. Analisis biaya produksi Dalam industri manufaktur, akuntan perlu menganalisis biaya produksi untuk mengidentifikasi area yang perlu perbaikan. Dengan menggunakan OCR, perusahaan dapat mengekstrak data dari dokumen seperti  work order  dan  purchase order . Data yang telah diekstrak kemudian dapat dianalisis untuk mengidentifikasi biaya langsung dan tidak langsung yang terkait dengan produksi suatu produk.

3. Pengelolaan dokumen pajak Perusahaan wajib menyimpan berbagai dokumen pajak seperti faktur pajak, nota kredit, dan bukti pembayaran pajak. Dengan menggunakan OCR, perusahaan dapat memindai dokumen-dokumen pajak dan mengekstrak data yang diperlukan untuk pelaporan pajak. Data yang telah diekstrak dapat disimpan dalam sebuah sistem manajemen dokumen yang terintegrasi dengan sistem akuntansi, sehingga memudahkan dalam penyusunan laporan pajak.

TERIMAKASIH
Tags