Berisi materi tentang text mining di bagian crawling, sentimen analysis, dan interpretasi hasil text mining

rizadamayanti2 7 views 9 slides Sep 12, 2025
Slide 1
Slide 1 of 9
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9

About This Presentation

Berisi materi tentang text mining di bagian crawling, sentimen analysis, dan interpretasi hasil text mining


Slide Content

Analisis Sentiment Ferry Irwandi
Kelompok:
1.Iqdam - 5052231036
2.Putra - 5052231008
3.Farras - 5052231002

Import Library
Kode ini bertujuan untuk
mengimpor semua library atau
pustaka Python yang
dibutuhkan untuk melakukan
proyek analisis sentimen, mulai
dari pengambilan data,
pembersihan, pengolahan,
analisis, hingga visualisasi hasil.

Mengambil dari API Youtube
Kode ini berfungsi untuk mengunduh
komentar secara otomatis dari satu
video YouTube tertentu menggunakan
API Key dan menyimpannya ke dalam
sebuah file CSV.

Data Clean & Analisis Frekuensi
Kode ini berfungsi untuk membersihkan
kata kata stopwords dalam bahasa
indonesia agar dapat diinterpretaikan.
kami juga melakukan custom stopword
untuk bahasa singkatan yang sudah
disesuaikan dengan konten commentar.

Analisis Sentimen
Metode ini menentukan sentimen sebuah
teks dengan cara mencocokkan kata-kata di
dalamnya dengan kamus sentimen yang
sudah kita definisikan sebelumnya. Awalnya
kami ingin menggunakan lexicon dengan cara
mentranslate commentar ke bahsa inggris
terlebih dahulu. Namun karena memberatkan
komputasi, pada akhirnya kami membuat
kamus sendiri yang dapat membedakan
sentimen positif dan negatif.

Analisis Sentimen
Setiap komentar akan dianalisis kata per kata.
Program akan menghitung berapa banyak kata dari
komentar tersebut yang masuk ke dalam
positive_words dan berapa banyak yang masuk ke
negative_words untuk menentukan sentimen
keseluruhannya.

Visualisasi Data
top 5 frekuensi kata yang sering
muncul adalah:
1.rakyat
2.demo
3.negara
4.geng
5.pemerintah

Visualisasi Data
Pada word cloud ini,
dapat dilihat
bahwasannya demo dan
rakyat memiliki frekuensi
paling besar
dibandingkan dengan
kata lainnya.

Visualisasi Data
Karena keterbatasan kamus sentiment
yang kita buat, model kami tidak bisa
mendeteksi lebih akurat terkait
pengelompokan sentimen. Berdasarkan
kamus yang kita buat, terdapt <10
komentar yang memiliki sentimen positif,
dan 11 komentar yang memiliki sentimen
negatif.
Tags