OPTIMASI ALGORITMA K-MEANS TERHADAP DATA OUTLIER MENGGUNAKAN ROBUST DALAM SEGMENTASI PELANGGAN BIZNET MEDAN

Authors

  • Dwina Pri Indini Universitas Pembangunan Panca Budi
  • Solly Ariza Universitas Pembangunan Panca Budi
  • Zulham Sitorus Universitas Pembangunan Panca Budi

DOI:

https://doi.org/10.54314/jssr.v9i3.6568

Keywords:

clustering, customer segmentation, k-means, outlier, robust scaling

Abstract

Abstract: The massive growth of internet penetration in Indonesia has created competitive competition among internet service providers (ISPs), including Biznet Medan. However, the highly diverse and heterogeneous characteristics of customers make one-size-fits-all marketing strategies ineffective and inefficient. Processing large customer data for segmentation is often hampered by the presence of outliers, such as extreme income variations, which can disrupt the clustering accuracy of conventional algorithms. This study aims to optimize the K-Means algorithm in segmenting Biznet Medan's target market to maintain accuracy despite outliers, allowing the company to design more targeted marketing strategies. To overcome K-Means' sensitivity to outliers, this study applies the Robust Scaling technique. This solution uses the Median and Interquartile Range (IQR) values ​​instead of the mean, so that the cluster center points (centroids) remain stable and are not distorted by extreme data values. The research flow includes data collection of prospective Biznet Medan customers, data pre-processing (cleaning and scaling), feature selection (income, distance, and network requirements), and implementation of the K-Means model. Cluster quality evaluation is carried out by comparing the results of using StandardScaler and RobustScaler through the Silhouette Score and Davies Bouldin Index (DBI) metrics. The implementation successfully formed two main segments: Cluster 0 (Enterprise/Premium Customers) with high income characteristics and large bandwidth requirements (>200 Mbps), and Cluster 1 (Casual/Economical Customers) who dominate the market with lower network requirements (<50 Mbps). Optimization with Robust showed significant improvements in the evaluation metrics, where the Silhouette Score increased from 0.3133 to 0.6023, and the DBI value improved from 1.1421 to 0.8007. The implementation of Robust Scaling is effectively able to handle outlier problems in the K-Means algorithm, resulting in a more robust, efficient, and representative cluster structure. These results contribute to the processing of customer data for more objective strategic decision-making in ISP market expansion.

Keywords: k-means; clustering; outlier; robust scaling; customer segmentation.

 

Abstrak: Pertumbuhan internet di Indonesia yang masif telah menciptakan persaingan kompetitif di antara penyedia jasa internet (ISP), termasuk Biznet Medan. Namun, karakteristik pelanggan yang sangat beragam dan bersifat heterogen membuat strategi pemasaran satu untuk semua (one-size-fits-all) menjadi tidak efektif dan tidak efisien. Data calon pelanggan yang besar sering ditemui data yang hilang, perbedaan nilai data yang ekstrim sehingga pengolahan data calon pelanggan untuk segmentasi sering kali terkendala oleh adanya data pencilan (outlier) yang dapat mengganggu akurasi pengelompokan pada algoritma konvensional. Penelitian ini bertujuan untuk mengoptimasi algoritma K-Means dalam melakukan segmentasi target pasar Biznet Medan agar tetap akurat meskipun terdapat data outlier, sehingga perusahaan dapat merancang strategi pemasaran yang lebih tepat sasaran. Untuk mengatasi sensitivitas K-Means terhadap pencilan, penelitian ini menerapkan teknik Robust Scaling. Solusi ini menggunakan nilai Median dan Interquartile Range (IQR) sebagai pengganti rata-rata, sehingga titik pusat klaster (centroid) tetap stabil dan tidak terdistorsi oleh nilai data yang ekstrem. Alur penelitian meliputi pengumpulan data calon pelanggan Biznet Medan, pra-pemrosesan data (pembersihan dan scaling), pemilihan fitur (penghasilan, jarak, dan kebutuhan jaringan), serta implementasi model K-Means. Evaluasi kualitas klaster dilakukan dengan membandingkan hasil penggunaan StandardScaler dan RobustScaler melalui metrik Silhouette Score dan Davies Bouldin Index (DBI). Implementasi berhasil membentuk dua segmen utama: Cluster 0 (Pelanggan Enterprise/Premium) dengan karakteristik penghasilan tinggi dan kebutuhan bandwidth besar (>200 Mbps), serta Cluster 1 (Pelanggan Casual/Hemat) yang mendominasi pasar dengan kebutuhan jaringan lebih rendah (<50 Mbps). Optimasi dengan Robust menunjukkan peningkatan signifikan pada metrik evaluasi, di mana Silhouette Score meningkat dari 0,3133 menjadi 0,6023, dan nilai DBI membaik dari 1,1421 menjadi 0,8007. Penerapan Robust Scaling secara efektif mampu menangani masalah outlier pada algoritma K-Means, menghasilkan struktur klaster yang lebih kuat, efisien, dan representatif. Hasil ini memberikan kontribusi pada pengolahan data pelanggan untuk pengambilan keputusan strategis yang lebih objektif dalam ekspansi pasar ISP.

Kata kunci: K-Means; klasterisasi; data pencilan; Robust Scaling; Segmentasi Pelanggan.

Downloads

Download data is not yet available.

References

Asosiasi Penyelenggara Jasa Internet Indonesia - Survei. (n.d.). Retrieved April 10, 2026, from https://survei.apjii.or.id/

Hakim, B., Kaunang, F. J., Susanto, C., Salim, J., & Indradjaja, R. (2025). Implementasi Machine Learning Dalam Pengelompokan Musik Menggunakan Algoritma K-Means Clustering. IDEALIS : InDonEsiA JournaL Information System, 8(1), 74–83. https://doi.org/10.36080/idealis.v8i1.3357

Harjoyudanto, Y. R., & Zulvia, P. (2023). Klusterisasi Pelanggan Potensial dengan Penggunaan Algoritma K-Means Dalam Mencari Segementasi Pasar (Studi Kasus GUTS Barber and Shop). Konferensi Nasional Ilmu …, 160–166. http://knia.stialanbandung.ac.id/index.php/knia/article/view/959

Hasan, Y. (2024). Pengukuran Silhouette Score Dan Davies-Bouldin Index Pada Hasil Cluster K-Means Dan Dbscan. Jurnal Informatika Dan Teknik Elektro Terapan, 12(3S1). https://doi.org/10.23960/jitet.v12i3s1.5001

Julian, A. (2025). Segmentasi Pelanggan Menggunakan Algoritma K-Means Pada Jaringan Telekomunikasi Untuk Optimalisasi Strategi Pemasaran. JTT (Jurnal Teknologi Terpadu), 13(1), 94–100. https://doi.org/10.32487/jtt.v13i1.2436

Khairul Abdi Sinuraya, Andri Nata, N. A. (2025). Penanganan Data Outlier Menggunakan Robust Cluster Dalam Pemetaan Dataset Stunting. 8(4), 5504–5510.

Khoirunnisa, A., & Ramadhan, N. G. (2023). Improving malaria prediction with ensemble learning and robust scaler: An integrated approach for enhanced accuracy. Jurnal Infotel, 15(4), 326–334. https://doi.org/10.20895/infotel.v15i4.1056

Kilo, N. A., Katili, M. R., & Hasan, I. K. (2025). Perbandingan Metode K-Means dan K-Medoids Dengan Validitas Davies-Bouldin Indeks, Dunn Indeks dan Indeks Connectivity Pada Pengelompokkan Masyarakat Penerima Bantuan Langsung Tunai. Research in the Mathematical and Natural Sciences, 4(1), 8–15. https://doi.org/10.55657/rmns.v4i1.190

Megiati, Y. E., Komari Pratiwi, N., Nurdiansyah, D., Yusuf, S., & Fauzi, T. R. (2024). Kapas : Kumpulan Artikel Pengabdian Masyarakat Bijak Bermedia Sosial sebagai Bentuk Pemanfaatan Internet Sehat. Kapas : Kumpulan Artikel Pengabdian Masyarakat, 2(3), 332–340.

N Tahta Phudjashakty, Hasbi Firmansyah, Wahyu Asriyani, & Ali Sofyan. (2026). Segmentasi Pelanggan Grosir Menggunakan K-Means: Analisis Outlier dan Ketidakseimbangan Data. Jurnal Pengabdian Masyarakat Dan Riset Pendidikan, 4(3), 15993–16002. https://doi.org/10.31004/jerkin.v4i3.4771

Nugraha, W., Sabaruddin, R., & Murni, S. (2024). Teknik Scaling Menggunakan Robust Scaler Untuk Mengatasi Outlier Data Pada Model Prediksi Serangan Jantung. Techno.Com, 23(2), 319–327. https://doi.org/10.62411/tc.v23i2.10463

Putri Azhiah, Jasmir, & Purnama Benni. (2025). Klasifikasi Kelayakan Penerima Beasiswa Menggunakan Naive Bayes dengan Optimasi Atribut Berbasis K-Means. Institut Riset Dan Publikasi Indonesia, 5(October), 1450–1462.

Rahmawati, T., Wilandari, Y., & Kartikasari, P. (2024). Analisis Perbandingan Silhouette Coefficient Dan Metode Elbow Pada Pengelompokkan Provinsi Di Indonesia Berdasarkan Indikator Ipm Dengan K-Medoids. Jurnal Gaussian, 13(1), 13–24. https://doi.org/10.14710/j.gauss.13.1.13-24

Sartika, D., Iqbal, M., & Sitorus, Z. (2025). Analisis Algoritma Exponensial Smoothing dan K-Means untuk Optimal- isasi Penerimaan Mahasiswa Baru di Universitas Haji Sumatera Utara. 07(02), 1–10.

Sitorus, Z., Iqbal, M., Putera Utama Siahaan, A., & Wahyuni, S. (2025). Analysis of The Sales Potential of BUMDES Products Using the K-Means Clustering Algorithm. International Journal of Computer Sciences and Mathematics Engineering, 4(1).

Sitorus, Z., Syahputra, I., Indra Angkat, C., & Sartika, D. (2024). Implementation of K-Means Clustering for Inventory Projection. International Journal of Science, Technology & Management, 5(3), 673–678. https://doi.org/10.46729/ijstm.v5i3.856

Sutiono, S., Wijaya, R. F., & Novelan, M. S. (2025). Analisis Metode K-Means Clustering Untuk Pengelompokan Jadwal Mengajar Guru Di SMKN 1 Stabat Dengan Visualisasi Data. INTECOMS: Journal of Information Technology and Computer Science, 8(2), 596–602. https://doi.org/10.31539/intecoms.v8i2.15154

Tentang Kami - Biznet Networks. (n.d.). Retrieved April 22, 2026, from https://www.biznetnetworks.com/company/about-us

Yulianti, G., Chaidir, M., & Pramono, A. S. (2024). Peran Teknologi Keuangan (Fintech) Dalam Mendorong Pertumbuhan Ekonomi Dan Inklusi Keuangan Di Indonesia: Tantangan Dan Peluang. Citizen : Jurnal Ilmiah Multidisiplin Indonesia, 4(4), 349–355. https://doi.org/10.53866/jimi.v4i4.649

Downloads

Published

2026-06-29

Issue

Section

Artikel