ANALISIS ALGORITMA K-MEANS CLUSTERING DALAM IDENTIFIKASI TINGKAT RISIKO PENYAKIT BERDASARKAN DATA REKAM MEDIS PASIEN
DOI:
https://doi.org/10.54314/jssr.v8i3.3551Abstrak
Abstract: This study aims to classify patients' health conditions based on six indicators: systolic blood pressure, diastolic blood pressure, fasting blood glucose, normal blood glucose, cholesterol level, and uric acid level using the K-Means Clustering method. The optimal number of clusters was determined using the Elbow Method and Silhouette Score, which resulted in five as the optimal number of clusters. The results show that the manual approach produces a more stable distribution that closely aligns with the clinical interpretation of cluster categories: Healthy (C1), Safe (C2), Alert (C3), Moderate (C4), and Severe (C5). Visualization was performed for each indicator through scatter plots and color mapping against normal value thresholds, aiding in the understanding of the distribution of patient conditions across clusters. The analysis reveals that even if a patient has one or more indicators within normal limits, they are not automatically classified into the Healthy or Safe clusters. Discrepancies in other indicators can place them in higher-risk clusters such as Alert, Moderate, or Severe. Therefore, this clustering approach provides a comprehensive view of health conditions based on a combination of features, rather than a single parameter. This research is useful in supporting early diagnosis and data-driven decision-making processes and can be integrated into health information systems for automatic risk classification of patient populations.
Â
Keywords: K-Means, Clustering, Health, Blood Pressure, Blood Glucose, Cholesterol, Uric Acid, Data Visualization
Abstrak: Penelitian ini bertujuan untuk mengelompokkan kondisi kesehatan pasien berdasarkan enam indikator, yaitu tekanan darah sistolik, tekanan darah diastolik, kadar gula puasa, kadar gula normal, kadar kolesterol, dan kadar asam urat menggunakan metode K-Means Clustering. Penentuan jumlah klaster optimal dilakukan dengan metode Elbow dan Silhouette Score, yang menghasilkan lima klaster sebagai jumlah optimal. Hasil menunjukkan bahwa pendekatan manual menghasilkan distribusi yang lebih stabil dan mendekati pemaknaan klinis dari kategori klaster, yaitu: Sehat (C1), Aman (C2), Waspada (C3), Sedang (C4), dan Berat (C5). Visualisasi dilakukan untuk setiap indikator melalui scatter plot dan pemetaan warna terhadap batas nilai normal, yang membantu dalam memahami sebaran kondisi pasien pada masing-masing klaster. Hasil analisis menunjukkan bahwa meskipun seorang pasien memiliki satu atau lebih indikator dalam batas normal, tidak secara otomatis tergolong dalam klaster Sehat atau Aman. Ketidaksesuaian pada indikator lainnya dapat menempatkan pasien ke dalam klaster yang lebih tinggi risikonya, seperti Waspada, Sedang, atau Berat. Oleh karena itu, pendekatan clustering ini memberikan gambaran menyeluruh terhadap kondisi kesehatan berdasarkan kombinasi fitur, bukan hanya pada satu parameter. Penelitian ini bermanfaat untuk mendukung proses diagnosis awal dan pengambilan keputusan berbasis data, serta dapat diintegrasikan dalam sistem informasi kesehatan untuk klasifikasi risiko populasi pasien secara otomatis.
Kata kunci: K-Means, Clustering, Kesehatan, Tekanan Darah, Gula Darah, Kolesterol, Asam Urat, Visualisasi Data
Unduhan
Referensi
Agustina, I., & Danar Dana, R. (2024). Implementasi K-Means Clustering untuk Pengelompokan Tingkat Kemiskinan di Pulau Jawa Menggunakan Bahasa Pemrograman Python. JATI (Jurnal Mahasiswa Teknik Informatika), 8(1), 945–951. https://doi.org/10.36040/jati.v8i1.8858
Bahri, S., Sembiring, F., Aziz, M. A., & Firmansyah, D. (2017). Analisis Pemetaan Tingkat Pengangguran di Pulau Jawa dan Bali dengan Metode K-Means. Jurnal Rekayasa Teknologi Nusa Putra, 4(1), 13–18. https://doi.org/10.52005/rekayasa.v4i1.142
Danny, M., & Muhidin, A. (2023). Analisis Prediksi Resiko Diabetes Tahap Awal Menggunakan Algoritma Naive Bayes. Jurnal Teknologi Informatika Dan Komputer, 9(2), 1443–1459. https://doi.org/10.37012/jtik.v9i2.2017
Febrianto, A., Achmadi, S., Sasmito, A. P., Industri, F. T., Baik, S., & Mining, D. (2021). PENERAPAN METODE K-MEANS UNTUK CLUSTERING PENGUNJUNG PERPUSTAKAAN ITN MALANG. 5(1), 61–70.
Hartini, T., Purnamasari, A. I., Bahtiar, A., & Kaslani. (2025). Implementasi Algoritma K-Means Clustering untuk Klasifikasi Diagnosis Penyakit Lambung. JATI (Jurnal Mahasiswa Teknik Informatika), 9(1), 76–83.
Iqbal, M., Mayasari, N., & Muslim. (2016). Analisis Performansi Software WEKA dan Rapidminer dalam Pengolahan Data Mining. Jurnal Teknik Dan Informatika, 3, 35–38.
Laksono, B., Syahidin, Y., & Yunengsih, Y. (2024). Implementasi Data Mining Klasterisasi Data Pasien Rawat Inap dengan Algoritma K-Means Clustering. Jurnal Teknologi Sistem Informasi Dan Aplikasi, 7(2), 621–627. https://doi.org/10.32493/jtsi.v7i2.39354
Maesaroh, M., Nur Padilah, T., & Haerul Jaman, J. (2024). Penerapan Algoritma K-Means Clustering pada Pengelompokan Daerah Penyebaran Diare di Provinsi Jawa Barat. JATI (Jurnal Mahasiswa Teknik Informatika), 7(4), 2783–2787. https://doi.org/10.36040/jati.v7i4.7208
Manalu, D. A., & Gunadi, G. (2022). Implementasi Metode Data Mining K-Means Clustering terhadap Data Pembayaran Transaksi Menggunakan Bahasa Pemrograman Python pada CV Digital Dimensi. Infotech: Journal of Technology Information, 8(1), 43–54. https://doi.org/10.37365/jti.v8i1.131
Marlina, L., Muslim, & Siahaan, A. P. U. (2016). Data Mining Classification Comparison (Naïve Bayes and C4.5 Algorithms). Inte Rnational Journal of Engineering Trends and Technology, 38(7), 380–383.
Ordila, R., Wahyuni, R., Irawan, Y., & Yulia Sari, M. (2020). Penerapan Data Mining untuk Pengelompokan Data Rekam Medis Pasien Berdasarkan Jenis Penyakit dengan Algoritma Clustering (Studi Kasus: Poli Klinik PT. Inecda). Jurnal Ilmu Komputer, 9(2), 148–153. https://doi.org/10.33060/JIK/2020/Vol9.Iss2.181
Rahmawati, L., Widya Sihwi, S., & Suryani, E. (2016). Analisa Clustering Menggunakan Metode K-Means Dan Hierarchical Clustering (Studi Kasus : Dokumen Skripsi Jurusan Kimia, Fmipa, Universitas Sebelas Maret). Jurnal Teknologi & Informasi ITSmart, 3(2), 66. https://doi.org/10.20961/its.v3i2.654
Setiawati, N. P., Nugroho, B. A., Setiawan, A. T., & Hartanti, D. (2023). Data Mining Untuk Klasifikasi Diagnosis Tingkat Keparahan Penyakit Diabetes Dengan Algoritma Logistik Regresi. Prosiding Seminar Nasional Teknologi Informasi Dan Bisnis.
Siahaan, A. P. U., & Afandi Syahputra. (2024). Pengenalan Sistem Antrian Berbasis Web di Kantor Dinas Kependudukan dan Pencatatan Sipil Kota Medan. Jurnal Hasil Pengabdian Masyarakat (JURIBMAS), 2(3), 251–263. https://doi.org/10.62712/juribmas.v2i3.154
Wala, J., Herman, & Umar, R. (2024). Implementasi K-Means Clustering pada Pengelompokan Pasien Penyakit Jantung. JISKA (Jurnal Informatika Sunan Kalijaga), 9(3), 205–216.
Yolanda, E., & Suhardi. (2023). Penerapan Algoritma K-Means Clustering Untuk Pengelompokan Data Pasien Rehabilitasi Narkoba. KLIK: Kajian Ilmiah Informatika Dan Komputer, 4(1), 182–191. https://doi.org/10.30865/klik.v4i1.1107




