Komparasi Algoritma Random Forest, Naïve Bayes, dan SVM pada Sentimen Kebijakan PPN 12%
Abstract
Media sosial, salah satunya Twitter, telah berkembang menjadi platform penting untuk orang-orang menyuarakan pendapat mereka pendapat mereka, mengkritik, dan mendukung berbagai kebijakan pemerintah. Rencana untuk menaikkan Pajak Pertambahan Nilai (PPN) menjadi 12% di Indonesia pada tahun 2025 adalah salah satu kebijakan yang banyak dibicarakan publik. Dengan menggunakan metode machine learning, penelitian ini bertujuan untuk menganalisis persepsi publik terhadap kebijakan tersebut. Dalam penelitian ini, Random Forest, Naive Bayes, dan Support Vector Machine (SVM) digunakan. Data yang digunakan terdiri dari 2747 tweet yang didapatkan melalui metode crawling menggunakan kata kunci "PPN 12%" dari April 2024 hingga Januari 2025. Setelah melalui tahapan preprocessing, data diberi label menggunakan kamus leksikon bahasa Indonesia dengan tiga kelas sentimen yakni positif, netral, dan negatif. Jumlah data positif sebanyak 689, data netral 544, dan data negatif 1460, yang menunjukkan adanya ketidakseimbangan kelas. Meskipun demikian, penelitian ini tidak menggunakan teknik augmentasi seperti oversampling atau undersampling. Sebagai gantinya, metrik evaluasi yang digunakan tidak hanya akurasi, tetapi juga precision, recall, dan f1-score pada masing-masing kategori dengan pendekatan weighted average, guna menghasilkan evaluasi yang lebih adil dan komprehensif. 2154 data latih dan 539 data uji dihasilkan setelah dataset dibagi menjadi 80% data latih dan 20% data uji secara acak. Data latih nantinya akan digunakan untuk pembangunan model, sementara data uji digunakan untuk mengevaluasi performanya. Metode Term Frequency-Inverse Document Frequency (TF-IDF), yang membantu dalam menentukan seberapa relevan suatu kata yang ada dalam dokumen, digunakan dalam proses ekstraksi fitur penelitian ini. Hasil pengujian menunjukkan bahwa SVM memiliki performa terbaik dengan akurasi 76,25%, diikuti oleh Random Forest 72,35%, dan Naive Bayes 60,66%. SVM juga memiliki nilai precision, recall, dan f1-score tertinggi dibandingkan dua algoritma lainnya, yang menunjukkan kemampuan algoritma untuk memberikan hasil prediksi yang lebih tepat dan seimbang. Hasilnya menunjukkan bahwa SVM paling efektif menangani data opini publik yang cenderung tidak eksplisit dan penuh nuansa di media sosial. Penelitian ini memberikan kontribusi dalam pemanfaatan data Twitter sebagai alat bantu analisis kebijakan publik, serta mendorong pemanfaatan machine learning dalam memahami persepsi masyarakat terhadap isu nasional.
References
M. Fachriza and Munawar, “Analisis Sentimen Kalimat Depresi Pada Pengguna Twitter Dengan Naive Bayes, Support Vector Machine, Random Forest,” 2023. [Online]. Available: http://studentjournal.umpo.ac.id/index.php/komputek
S. Sekioka, R. Hatano, and H. Nishiyama, “Market Prediction using Machine Learning Based on Social Media Specific Features,” Artif Life Robot, vol. 28, no. 2, pp. 410–417, May 2023, doi: 10.1007/s10015-023-00857-z.
T. Krisdiyanto, E. Maricha, and O. Nurharyanto, “Analisis Sentimen Opini Masyarakat Indonesia Terhadap Kebijakan PPKM pada Media Sosial Twitter Menggunakan Naïve Bayes Clasifiers,” Jurnal CoreIT, vol. 7, no. 1, 2021.
A. Azrul, A. I. Purnamasari, and I. Ali, “Analisis Sentimen Pengguna Twitter Terhadap Perkembangan Artificial Intelligence dengan Penerapan Algoritma Long Short-Term Memory (LSTM),” 2024.
R. E. Yani, E. Simandalahi, and A. R. Nasution, “Pengaruh PPN (Pajak Pertambahan Nilai) terhadap Pendapatan Nasional,” Eksis: Jurnal Ilmiah Ekonomi dan Bisnis, vol. 15, no. 1, p. 30, May 2024, doi: 10.33087/eksis.v15i1.424.
I. Mega Putri, “Kenaikan PPN 12% dan Dampaknya Terhadap Ekonomi,” vol. 8, no. 2, 2024.
P. Elisa and A. Rahman Isnain, “Comparison of Random Forest, Support Vector Machine and Naive Bayes Algorithms to Analyze Sentiment Towards Mental Health Stigma,” Jurnal Teknik Informatika (JUTIF), vol. 5, no. 1, pp. 321–329, 2024, doi: 10.52436/1.jutif.2024.5.1.1817.
M. Amien, “Sejarah dan Perkembangan Teknik Natural Language Processing (NLP) Bahasa Indonesia: Tinjauan tentang sejarah, perkembangan teknologi, dan aplikasi NLP dalam bahasa Indonesia,” 2023.
I. Irawan, Wardianto, M. H. Wathan, and M. B. Prayogi, “Studi Perbandingan: Algoritma Random Forest, Naive Bayes Dan Support Vector Machine Dalam Analisis Sentimen Pada Aplikasi Capcut Di Google Play Store,” vol. Vol. 5, 2024.
A. Miftahusalam, A. Febby Nuraini, A. A. Khoirunisa, and H. Pratiwi, “Perbandingan Algoritma Random Forest, Naïve Bayes, dan Support Vector Machine Pada Analisis Sentimen Twitter Mengenai Opini Masyarakat Terhadap Penghapusan Tenaga Honorer,” 2022.
M. I. Fikri, T. S. Sabrila, and Y. Azhar, “Perbandingan Metode Naïve Bayes dan Support Vector Machine pada Analisis Sentimen Twitter,” SMATIKA JURNAL, vol. 10, no. 02, pp. 71–76, Dec. 2020, doi: 10.32664/smatika.v10i02.455.
G. K. V. Natalianus and R. Feta, “Perbandingan Akurasi Algoritma Naïve Bayes Dan Support Vector Machine Dalam Analisis Sentimen Pengguna Twitter Terhadap Aplikasi Sirekap,” Fountain of Informatics Journal, vol. 9, no. 2, pp. 2548–5113, 2024, doi: 10.21111/fij.v9i2.12717.
M. R. Kusuma, W. Gata, L. Kurniawati, A. F. Rivan, and T. Kurniawan, “Analisis sentimen masyarakat terhadap informasi penerapan PPN atas renovasi dan membangun rumah sendiri pada media sosial youtube dengan metode svm dan naive bayes,” Jurnal Digital Teknologi Informasi, vol. 6, no. 2, Sep. 2023, doi: 10.32502/digital.v6i2.4758.
A. A. Syahidin, M. R. Alwi, Subandi, and M. R. Hariyadi, “Analisis Sentimen Data Twitter Terhadap Pelaksanaan Pembelajaran Online di Indonesia Pada Masa Pandemi Covid-19 Menggunakan Metode Natural Language Processing,” JURSISTEKNI (Jurnal Sistem Informasi dan Teknologi Informasi), 2023.
T. Widyanto, I. Ristiana, and A. Wibowo, “Komparasi Naïve Bayes dan SVM Analisis Sentimen RUU Kesehatan di Twitter,” 2023, [Online]. Available: https://doi.org/10.31598
A. I. Tanggraeni and M. N. N. Sitokdana, “Analisis Sentimen Aplikasi E-Government Pada Google Play Menggunakan Algoritma Naïve Bayes,” vol. 9, no. 2, pp. 785–795, 2022.
C. Michael Lauwl, Husain, B. Nadila Nuzululnisa, and H. Wijaya, “Komparasi Metode Random Forest Dan Support Vector Machine (SVM) Untuk Pemodelan Klasifikasi Serangan DDos,” Journal of Information System Research, vol. 6, no. 2, pp. 1471–1478, 2025, doi: 10.47065/josh.v6i2.6684.
T. Misriati and R. Aryanti, “Optimalisasi Random Forest dan Support Vector Machine dengan Hyperparameter GridSearchCV untuk Analisis Sentimen Ulasan PrimaKu,” Journal of Information System Research (JOSH), vol. 5, no. 4, pp. 1333–1341, 2024, doi: 10.47065/josh.v5i4.5347.
A. Dirgahayu Zendrato, S. Sandino Berutu, el Pieter Sumihar, and H. Budiati, “Pengembangan Model Klasifikasi Sentimen Dengan Pendekatan Vader dan Algoritma Naive Bayes Terhadap Ulasan Aplikasi Indodax,” Journal of Information System Research (JOSH), vol. 5, no. 3, pp. 755–764, 2024, doi: 10.47065/josh.v5i3.5050.
R. Rifaldi et al., “Analisis Sentimen Pemboikotan Produk dengan Pendekatan Algoritma Naïve Bayes Media Sosial X,” Journal of Information System Research (JOSH), vol. 5, no. 4, pp. 940–946, 2024, doi: 10.47065/josh.v5i4.5420.
R. Torhino and N. Andono, “Penerapan Algoritma Random Forest dalam Prediksi Curah Hujan untuk Mendukung Analisis Cuaca,” Technology and Science (BITS), vol. 6, no. 3, pp. 1688–1699, 2024, doi: 10.47065/bits.v6i3.6404.
H. Gemasih and I. Nizar, “Implementasi Algoritma Naive Bayes Untuk Memprediksi Tingkat Penyebaran Covid,” 2022.
K. Verena, S. Toy, Y. A. Sari, and I. Cholissodin, “Analisis Sentimen Twitter menggunakan Metode Naive Bayes dengan Relevance Frequency Feature Selection (Studi Kasus: Opini Masyarakat Mengenai Kebijakan New Normal),” 2021. [Online]. Available: http://j-ptiik.ub.ac.id
H. Eldo, A. Ayuliana, D. Suryadi, G. Chrisnawati, and L. Judijanto, “Penggunaan Algoritma Support Vector Machine (SVM) Untuk Deteksi Penipuan pada Transaksi Online,” Jurnal Minfo Polgan, vol. 13, no. 2, pp. 1627–1632, Oct. 2024, doi: 10.33395/jmp.v13i2.14186.
R. Nurhidayat and K. E. Dewi, “KOMPUTA : Jurnal Ilmiah Komputer dan Informatika Penerapan Algoritma K-Nearest Neighbor Dan Fitur Ekstraksi N-Gram Dalam Analisis Sentimen Berbasis Aspek,” vol. 12, no. 1, 2023, [Online]. Available: https://www.kaggle.com/datasets/hafidahmusthaanah/skincare-review?select=00.+Review.csv.













