IndoBERT vs SVM

IndoBERT Fine-Tuning for Sentiment Classification on #KaburAjaDulu Tweets 🚀

IndoBERT Embeddings + SVM for Sentiment Classification on #KaburAjaDulu Tweets 🚀

Proyek ini berfokus pada fine-tuning model [IndoBERT] dan [IndoBERT] Embeddings sebagai feature exctration dengan [SVM] (https://huggingface.co/indobenchmark/indobert-base-p2) untuk tugas klasifikasi sentimen terhadap tweet berbahasa Indonesia yang menggunakan tagar #KaburAjaDulu.

🔍 Latar Belakang

"#KaburAjaDulu" menjadi tagar yang cukup viral di media sosial Indonesia, mencerminkan opini publik terhadap isu-isu sosial, politik, atau lingkungan. Penelitian ini mencoba mengklasifikasikan sentimen dari tweet-tweet tersebut ke dalam 3 kelas:

0: Positif
1: Netral
2: Negatif

📊 Dataset

Dataset yang digunakan adalah hasil crawling dari Twitter menggunakan tagar #KaburAjaDulu. Dataset ini terdiri dari 20.968 tweet yang telah dilabeli secara pseudo-labeling ke dalam 3 kelas sentimen.

🧠 Model

Model yang digunakan untuk pseudo-labeling adalah [IndoBERT] (https://huggingface.co/ayameRushia/bert-base-indonesian-1.5G-sentiment-analysis-smsa) yang merupakan model BERT yang telah dilatih pada korpus bahasa Indonesia. Model ini diambil dari Hugging Face Model Hub dan digunakan untuk menghasilkan representasi teks yang lebih baik untuk klasifikasi sentimen. Model yang digunakan untuk fine-tuning dan embeddings extraction adalah indobenchmark/indobert-base-p2, dilatih menggunakan Hugging Face Trainer dengan parameter fine-tuning sebagai berikut:

learning_rate = 2e-5
batch_size = 16
epochs = 5
weight_decay = 0.01

🛠 Teknologi & Tools

Hugging Face Transformers 🤗

PyTorch

Scikit-learn

Evaluate (accuracy, F1-score)

Matplotlib (visualisasi loss & akurasi)

🤝 Kontribusi

Kontribusi terbuka! Jangan ragu untuk membuat issue atau pull request jika ingin meningkatkan proyek ini.

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
Notebooks		Notebooks
data		data
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

IndoBERT vs SVM

IndoBERT Fine-Tuning for Sentiment Classification on #KaburAjaDulu Tweets 🚀

IndoBERT Embeddings + SVM for Sentiment Classification on #KaburAjaDulu Tweets 🚀

🔍 Latar Belakang

📊 Dataset

🧠 Model

🛠 Teknologi & Tools

🤝 Kontribusi

📜 Lisensi

About

Uh oh!

Releases

Packages

Languages

License

EricoAstama/IndoBERTvsSVM

Folders and files

Latest commit

History

Repository files navigation

IndoBERT vs SVM

IndoBERT Fine-Tuning for Sentiment Classification on #KaburAjaDulu Tweets 🚀

IndoBERT Embeddings + SVM for Sentiment Classification on #KaburAjaDulu Tweets 🚀

🔍 Latar Belakang

📊 Dataset

🧠 Model

🛠 Teknologi & Tools

🤝 Kontribusi

📜 Lisensi

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages