ANALISIS ALGORITMA K-MEANS CLUSTERING DALAM IDENTIFIKASI TINGKAT RISIKO PENYAKIT BERDASARKAN DATA REKAM MEDIS PASIEN

Authors

  • Wina Aulia Universitas Pembangunan Panca Budi
  • Andysah Putera Utama Siahaan Universitas Pembangunan Panca Budi
  • Leni Marlina Universitas Pembangunan Panca Budi
  • Khairul Khairul Universitas Pembangunan Panca Budi
  • Muhammad Iqbal Universitas Pembangunan Panca Budi

DOI:

https://doi.org/10.54314/jssr.v8i3.3551

Abstract

Abstract: This study aims to classify patients' health conditions based on six indicators: systolic blood pressure, diastolic blood pressure, fasting blood glucose, normal blood glucose, cholesterol level, and uric acid level using the K-Means Clustering method. The optimal number of clusters was determined using the Elbow Method and Silhouette Score, which resulted in five as the optimal number of clusters. The results show that the manual approach produces a more stable distribution that closely aligns with the clinical interpretation of cluster categories: Healthy (C1), Safe (C2), Alert (C3), Moderate (C4), and Severe (C5). Visualization was performed for each indicator through scatter plots and color mapping against normal value thresholds, aiding in the understanding of the distribution of patient conditions across clusters. The analysis reveals that even if a patient has one or more indicators within normal limits, they are not automatically classified into the Healthy or Safe clusters. Discrepancies in other indicators can place them in higher-risk clusters such as Alert, Moderate, or Severe. Therefore, this clustering approach provides a comprehensive view of health conditions based on a combination of features, rather than a single parameter. This research is useful in supporting early diagnosis and data-driven decision-making processes and can be integrated into health information systems for automatic risk classification of patient populations.

 

Keywords: K-Means, Clustering, Health, Blood Pressure, Blood Glucose, Cholesterol, Uric Acid, Data Visualization

Abstrak: Penelitian ini bertujuan untuk mengelompokkan kondisi kesehatan pasien berdasarkan enam indikator, yaitu tekanan darah sistolik, tekanan darah diastolik, kadar gula puasa, kadar gula normal, kadar kolesterol, dan kadar asam urat menggunakan metode K-Means Clustering. Penentuan jumlah klaster optimal dilakukan dengan metode Elbow dan Silhouette Score, yang menghasilkan lima klaster sebagai jumlah optimal. Hasil menunjukkan bahwa pendekatan manual menghasilkan distribusi yang lebih stabil dan mendekati pemaknaan klinis dari kategori klaster, yaitu: Sehat (C1), Aman (C2), Waspada (C3), Sedang (C4), dan Berat (C5). Visualisasi dilakukan untuk setiap indikator melalui scatter plot dan pemetaan warna terhadap batas nilai normal, yang membantu dalam memahami sebaran kondisi pasien pada masing-masing klaster. Hasil analisis menunjukkan bahwa meskipun seorang pasien memiliki satu atau lebih indikator dalam batas normal, tidak secara otomatis tergolong dalam klaster Sehat atau Aman. Ketidaksesuaian pada indikator lainnya dapat menempatkan pasien ke dalam klaster yang lebih tinggi risikonya, seperti Waspada, Sedang, atau Berat. Oleh karena itu, pendekatan clustering ini memberikan gambaran menyeluruh terhadap kondisi kesehatan berdasarkan kombinasi fitur, bukan hanya pada satu parameter. Penelitian ini bermanfaat untuk mendukung proses diagnosis awal dan pengambilan keputusan berbasis data, serta dapat diintegrasikan dalam sistem informasi kesehatan untuk klasifikasi risiko populasi pasien secara otomatis.

Kata kunci: K-Means, Clustering, Kesehatan, Tekanan Darah, Gula Darah, Kolesterol, Asam Urat, Visualisasi Data

Downloads

Download data is not yet available.

References

Agustina, I., & Danar Dana, R. (2024). Implementasi K-Means Clustering untuk Pengelompokan Tingkat Kemiskinan di Pulau Jawa Menggunakan Bahasa Pemrograman Python. JATI (Jurnal Mahasiswa Teknik Informatika), 8(1), 945–951. https://doi.org/10.36040/jati.v8i1.8858

Bahri, S., Sembiring, F., Aziz, M. A., & Firmansyah, D. (2017). Analisis Pemetaan Tingkat Pengangguran di Pulau Jawa dan Bali dengan Metode K-Means. Jurnal Rekayasa Teknologi Nusa Putra, 4(1), 13–18. https://doi.org/10.52005/rekayasa.v4i1.142

Danny, M., & Muhidin, A. (2023). Analisis Prediksi Resiko Diabetes Tahap Awal Menggunakan Algoritma Naive Bayes. Jurnal Teknologi Informatika Dan Komputer, 9(2), 1443–1459. https://doi.org/10.37012/jtik.v9i2.2017

Febrianto, A., Achmadi, S., Sasmito, A. P., Industri, F. T., Baik, S., & Mining, D. (2021). PENERAPAN METODE K-MEANS UNTUK CLUSTERING PENGUNJUNG PERPUSTAKAAN ITN MALANG. 5(1), 61–70.

Hartini, T., Purnamasari, A. I., Bahtiar, A., & Kaslani. (2025). Implementasi Algoritma K-Means Clustering untuk Klasifikasi Diagnosis Penyakit Lambung. JATI (Jurnal Mahasiswa Teknik Informatika), 9(1), 76–83.

Iqbal, M., Mayasari, N., & Muslim. (2016). Analisis Performansi Software WEKA dan Rapidminer dalam Pengolahan Data Mining. Jurnal Teknik Dan Informatika, 3, 35–38.

Laksono, B., Syahidin, Y., & Yunengsih, Y. (2024). Implementasi Data Mining Klasterisasi Data Pasien Rawat Inap dengan Algoritma K-Means Clustering. Jurnal Teknologi Sistem Informasi Dan Aplikasi, 7(2), 621–627. https://doi.org/10.32493/jtsi.v7i2.39354

Maesaroh, M., Nur Padilah, T., & Haerul Jaman, J. (2024). Penerapan Algoritma K-Means Clustering pada Pengelompokan Daerah Penyebaran Diare di Provinsi Jawa Barat. JATI (Jurnal Mahasiswa Teknik Informatika), 7(4), 2783–2787. https://doi.org/10.36040/jati.v7i4.7208

Manalu, D. A., & Gunadi, G. (2022). Implementasi Metode Data Mining K-Means Clustering terhadap Data Pembayaran Transaksi Menggunakan Bahasa Pemrograman Python pada CV Digital Dimensi. Infotech: Journal of Technology Information, 8(1), 43–54. https://doi.org/10.37365/jti.v8i1.131

Marlina, L., Muslim, & Siahaan, A. P. U. (2016). Data Mining Classification Comparison (Naïve Bayes and C4.5 Algorithms). Inte Rnational Journal of Engineering Trends and Technology, 38(7), 380–383.

Ordila, R., Wahyuni, R., Irawan, Y., & Yulia Sari, M. (2020). Penerapan Data Mining untuk Pengelompokan Data Rekam Medis Pasien Berdasarkan Jenis Penyakit dengan Algoritma Clustering (Studi Kasus: Poli Klinik PT. Inecda). Jurnal Ilmu Komputer, 9(2), 148–153. https://doi.org/10.33060/JIK/2020/Vol9.Iss2.181

Rahmawati, L., Widya Sihwi, S., & Suryani, E. (2016). Analisa Clustering Menggunakan Metode K-Means Dan Hierarchical Clustering (Studi Kasus : Dokumen Skripsi Jurusan Kimia, Fmipa, Universitas Sebelas Maret). Jurnal Teknologi & Informasi ITSmart, 3(2), 66. https://doi.org/10.20961/its.v3i2.654

Setiawati, N. P., Nugroho, B. A., Setiawan, A. T., & Hartanti, D. (2023). Data Mining Untuk Klasifikasi Diagnosis Tingkat Keparahan Penyakit Diabetes Dengan Algoritma Logistik Regresi. Prosiding Seminar Nasional Teknologi Informasi Dan Bisnis.

Siahaan, A. P. U., & Afandi Syahputra. (2024). Pengenalan Sistem Antrian Berbasis Web di Kantor Dinas Kependudukan dan Pencatatan Sipil Kota Medan. Jurnal Hasil Pengabdian Masyarakat (JURIBMAS), 2(3), 251–263. https://doi.org/10.62712/juribmas.v2i3.154

Wala, J., Herman, & Umar, R. (2024). Implementasi K-Means Clustering pada Pengelompokan Pasien Penyakit Jantung. JISKA (Jurnal Informatika Sunan Kalijaga), 9(3), 205–216.

Yolanda, E., & Suhardi. (2023). Penerapan Algoritma K-Means Clustering Untuk Pengelompokan Data Pasien Rehabilitasi Narkoba. KLIK: Kajian Ilmiah Informatika Dan Komputer, 4(1), 182–191. https://doi.org/10.30865/klik.v4i1.1107

Downloads

Published

2025-08-28

How to Cite

ANALISIS ALGORITMA K-MEANS CLUSTERING DALAM IDENTIFIKASI TINGKAT RISIKO PENYAKIT BERDASARKAN DATA REKAM MEDIS PASIEN. (2025). JOURNAL OF SCIENCE AND SOCIAL RESEARCH, 8(3), 3457-3465. https://doi.org/10.54314/jssr.v8i3.3551

Most read articles by the same author(s)

1 2 > >>