ANALISIS SENTIMEN MASYARAKAT MENGGUNAKAN ALGORITMA NAÃVE BAYES DAN SUPPORT VECTOR MACHINE TERHADAP PROGRAM BPJS

Authors

  • Charisman Fajri Saputra Universitas Putra Indonesia "YPTK" http://orcid.org/0009-0004-9121-7092
  • Rini Sovia Universitas Putra Indonesia "YPTK"
  • Agung Ramadhanu Universitas Putra Indonesia "YPTK"

DOI:

https://doi.org/10.54314/jssr.v9i1.5660

Abstract

Abstract: BPJS Kesehatan is a national health insurance program that plays a vital role in providing public health services in Indonesia; however, its implementation has generated diverse public perceptions reflected on social media. This study analyzes public sentiment toward the BPJS Kesehatan program based on Instagram comments using a text mining and machine learning approach. The research methodology includes Indonesian text preprocessing, feature weighting using Term Frequency–Inverse Document Frequency (TF–IDF), and three-class sentiment classification (positive, negative, and neutral) using Multinomial Naïve Bayes and Support Vector Machine (SVM) algorithms. The dataset consists of 1,461 Instagram comments, which are divided into training and testing data with an 80:20 ratio. The experimental results show that Multinomial Naïve Bayes achieves an accuracy of 80.55%, while SVM yields a higher accuracy of 86.35%. These results indicate that SVM performs better in separating sentiment classes within short and imbalanced Instagram comment data. This study contributes to Indonesian-language sentiment analysis research and provides insights for evaluating public health services through social media data. Keyword: sentiment analysis; BPJS Kesehatan; Instagram; Naïve Bayes; Support Vector Machine. Abstrak: BPJS Kesehatan merupakan program strategis nasional yang berperan penting dalam menjamin akses layanan kesehatan bagi masyarakat Indonesia, namun implementasinya masih memunculkan beragam persepsi publik yang tercermin pada media sosial. Penelitian ini mengkaji analisis sentimen masyarakat terhadap program BPJS Kesehatan berdasarkan komentar pada platform Instagram menggunakan pendekatan text mining dan pembelajaran mesin. Metode penelitian meliputi pra-pemrosesan teks berbahasa Indonesia, pembobotan fitur menggunakan Term Frequency–Inverse Document Frequency (TF–IDF), serta klasifikasi sentimen tiga kelas (positif, negatif, dan netral) menggunakan algoritma Multinomial Naïve Bayes dan Support Vector Machine (SVM). Dataset yang digunakan terdiri dari 1.461 komentar Instagram yang dibagi menjadi data latih dan data uji dengan rasio 80:20. Hasil pengujian menunjukkan bahwa Multinomial Naïve Bayes menghasilkan akurasi sebesar 80,55%, sedangkan SVM mencapai akurasi yang lebih tinggi yaitu 86,35%. Temuan ini menunjukkan bahwa SVM memiliki kemampuan yang lebih baik dalam memisahkan kelas sentimen pada data komentar Instagram yang bersifat pendek dan tidak seimbang. Penelitian ini diharapkan dapat memberikan kontribusi dalam pengembangan analisis sentimen berbahasa Indonesia serta menjadi masukan awal bagi evaluasi layanan publik berbasis media sosial. Kata kunci: analisis sentimen; BPJS Kesehatan; Instagram; Naïve Bayes; Support Vector Machine.

Downloads

Download data is not yet available.

References

Alzu’bi, A., Alweshah, H., & Al-Ayyoub, M. (2024). Support vector machine for text classification: A review. Artificial Intelligence Review, 57, 1–29. https://doi.org/10.1007/s10462-023-10499-6

Amien, A. (2023). Implementasi pipeline NLP bahasa Indonesia menggunakan Sastrawi. Jurnal Rekayasa Perangkat Lunak, 4(2), 101–109.

Assiroj, A., Iqbal, M., & Hidayat, R. (2023). Evaluasi metode pembobotan fitur pada analisis sentimen bahasa Indonesia. Jurnal Teknologi Informasi dan Ilmu Komputer, 10(4), 345–354.

BPJS Kesehatan. (2025). Profil BPJS Kesehatan. Jakarta, Indonesia: BPJS Kesehatan.

Dewan Jaminan Sosial Nasional. (2024). Evaluasi penyelenggaraan program JKN tahun 2024. Jakarta, Indonesia: DJSN.

Fetahi, M. (2025). TF–IDF effectiveness for short and noisy text classification. Expert Systems with Applications, 236, 1–12. https://doi.org/10.1016/j.eswa.2024.121027

Hakiki, A., Saputra, D., & Firmansyah, Y. (2024). Perbandingan metode klasifikasi sentimen pada data media sosial berbahasa Indonesia. Jurnal Informatika, 12(1), 33–44.

Hanum, S., Putra, A., & Kurniawan, L. (2025). Analisis performa TF–IDF pada klasifikasi sentimen bahasa Indonesia. Jurnal Data Science Indonesia, 3(1), 15–24.

IBM. (2024). Naïve Bayes classifier. IBM Documentation. https://www.ibm.com/docs/

Jannah, J., Sutikno, R., & Maulana, A. (2024). Implementasi multinomial naïve bayes untuk klasifikasi sentimen layanan publik. Jurnal Sistem Cerdas, 7(2), 88–97.

Kemp, G. (2025). Digital 2025: Global overview report. Singapore: DataReportal. https://datareportal.com

Kumar, S., & Ravi, V. (2023). High-dimensional text classification using linear SVM. IEEE Transactions on Knowledge and Data Engineering, 35(6), 5123–5135. https://doi.org/10.1109/TKDE.2022.3154321

Leandro, L., Nugroho, R., & Santoso, A. (2025). Sentiment analysis of public services using social media data: A systematic review. Information Processing & Management, 62(1), 1–14. https://doi.org/10.1016/j.ipm.2024.103498

Mardiah, N., & Marlina. (2024). Analisis sentimen komentar Instagram menggunakan metode machine learning. Jurnal Teknologi Informasi, 8(3), 201–210.

Nurrizky, R., Hidayat, A., & Putri, L. (2024). Pemanfaatan Instagram sebagai sumber data analisis opini publik. Jurnal Media dan Komunikasi, 6(2), 89–98.

Prasetyo, N., Wijaya, A., & Kurniawan, R. (2025). Sentiment analysis of Mobile JKN application reviews using TF–IDF. Journal of Information Systems, 9(1), 25–34.

Pratama, M., Rivan, A., & Yuliani, S. (2025). Analisis sentimen opini publik berbasis media sosial terhadap kebijakan pemerintah. Jurnal Sistem Informasi, 21(1), 45–56.

Rahayu, S., Lestari, D., & Saputra, M. (2025). Analisis sentimen layanan BPJS Kesehatan menggunakan SVM. Jurnal Sistem Informasi dan Kesehatan, 4(2), 101–110.

Rahmat, A., & Lie, H. (2024). Evaluasi kepuasan peserta terhadap layanan BPJS Kesehatan di Indonesia. Jurnal Administrasi Publik, 15(2), 120–132.

Rizki, R., Nugraha, A., & Amien, D. (2023). Tantangan NLP pada bahasa Indonesia di media sosial. Jurnal Ilmu Komputer dan Informasi, 9(2), 65–74.

Shirole, S. (2023). Sentiment analysis: Concepts, techniques, and applications. New York, NY: Springer. https://doi.org/10.1007/978-3-031-24376-5

Siino, G., Ferrari, M., & Lombardi, L. (2024). Reproducibility challenges in sentiment analysis research. IEEE Access, 12, 45621–45634. https://doi.org/10.1109/ACCESS.2024.3367890

Siswanto, M., Putri, R., & Nugroho, A. (2024). Handling class imbalance in sentiment analysis of health service applications. IEEE Access, 12, 90211–90222. https://doi.org/10.1109/ACCESS.2024.3381123

Sihombing, J., & Ritonga, R. (2024). Implementasi TF–IDF untuk klasifikasi teks pendek berbahasa Indonesia. Jurnal Teknologi dan Sistem Komputer, 11(2), 77–86.

Suryani, S., Rizki, R., & Handayani, E. (2023). Pengaruh normalisasi slang terhadap performa analisis sentimen bahasa Indonesia. Jurnal Linguistik Komputasional, 5(1), 1–11.

Sutikno, R., Nugraha, A., & Permata, D. (2025). Perbandingan naïve bayes dan SVM pada analisis sentimen BPJS di Twitter. Jurnal Informatika Indonesia, 6(1), 40–49.

Wibowo, H. P., Nugroho, A., & Setiawan, R. (2024). Pengaruh representasi fitur terhadap akurasi klasifikasi teks. Jurnal Informatika dan Komputer, 10(1), 55–66.

Downloads

Published

2026-02-19

How to Cite

ANALISIS SENTIMEN MASYARAKAT MENGGUNAKAN ALGORITMA NAÏVE BAYES DAN SUPPORT VECTOR MACHINE TERHADAP PROGRAM BPJS. (2026). JOURNAL OF SCIENCE AND SOCIAL RESEARCH, 9(1), 944-952. https://doi.org/10.54314/jssr.v9i1.5660

Most read articles by the same author(s)

1 2 > >>