Twitter Sentiment Analysis

less than 1 minute read

Twitter-Sentiment-Analysis---NLP

Overview

Tweet-tweet yang digunakan pada project ini adalah tweet-tweet yang berhubungan dengan kata: AlbertEinstein. Project ini bertujuan untuk menganalisa sentimen pada kata AlbertEinstein di twitter. Kemudian pada akhirnya, ada sedikit modeling. Dimana saya menggunakan MultinominalNaiveBayes.

Summary

Words Cloud

GitHub Logo

Dari gambar di atas, dapat dilihat kontribusi-kontribusi Einstein di dunia fisika, seperti misalnya relativitas umum dan lubang hitam. Terlihat juga ada kata Hawking dan Brian Greene di atas, dua fisikawan yang saya sangat kagumi. Menarik bisa melihat ada kata ‘confirm’ di atas, mungkin ini berhubungan dengan penemuan beberapa tahun yang lalu tentang gelombang gravitasi.

Sentiment Analysis

GitHub Logo

Kebanyakan tweet-tweet di dataset ini adalah tweet-tweet yang positive.

Evaluation Metrics

Evaluasi metrik yang akan menjadi titik tumpuan adalah Accuracy dan F1-Score (Macro-Average), dan ini hasilnya:

Classifier Accuracy F1-Macro Score
Multinominal Naive Bayes 0.80 0.80

Pada saat melakukan sanity check, sayangnya model tidak melakukannya dengan baik. Harus dilakukan pencarian hyperparameter tuning yang lebih baik atau melakukan pencarian model lainnya, selain Multinominal Naive Bayes. Namun karena tujuan dari project ini lebih mengarah ke sentiment analysis, jadi saya berhenti di model Naive Bayes.