PERBANDINGAN METODE RANDOM FOREST DAN KNN DALAM MENDETEKSI PENYAKIT LIVER

Authors

  • Jordan Johan Josafat Simanjuntak Universitas Kristen Satya Wacana
  • Magdalena A. Ineke Pakereng Universitas Kristen Satya Wacana

DOI:

https://doi.org/10.31539/j9se3a69

Abstract

Penyakit hati merupakan masalah kesehatan global yang semakin diperburuk oleh gaya hidup tidak sehat, seperti konsumsi alkohol yang berlebihan dan deteksi dini yang tidak memadai. Oleh karena itu, pendekatan berbasis teknologi diperlukan untuk meningkatkan akurasi diagnosis. Penelitian ini bertujuan untuk membandingkan kinerja metode pembelajaran mesin Random Forest dan K-Nearest Neighbor dalam mengklasifikasikan penyakit hati berdasarkan faktor klinis dan gaya hidup pasien. Data diperoleh dengan menggabungkan dua dataset terbuka, yang totalnya berjumlah 2.283 entri dan 19 fitur, termasuk parameter laboratorium, usia, konsumsi alkohol, dan riwayat kesehatan. Tahapan penelitian meliputi pra-pemrosesan data, termasuk imputasi nilai yang hilang, pengkodean variabel kategorikal, normalisasi fitur numerik, rekayasa fitur, dan penyeimbangan kelas menggunakan Teknik Oversampling Minoritas Sintetis. Dataset kemudian dibagi menjadi 80% data pelatihan dan 20% data pengujian secara stratifikasi. Evaluasi model dilakukan menggunakan matriks kebingungan, akurasi, presisi, recall, F1-score, dan Area Di Bawah Kurva Receiver Operating Characteristic. Hasil menunjukkan bahwa Random Forest memiliki kinerja lebih baik dengan akurasi 82% dan nilai Area Di Bawah Kurva 0,91, dibandingkan dengan K-Nearest Neighbor yang mencapai akurasi 72% dan Area Di Bawah Kurva 0,83. Selain itu, Random Forest menghasilkan jumlah negatif palsu yang lebih rendah, menjadikannya lebih dapat diandalkan dalam mendeteksi pasien dengan penyakit hati. Oleh karena itu, Random Forest direkomendasikan sebagai metode yang lebih efektif dan stabil untuk sistem deteksi dini penyakit hati berbasis pembelajaran mesin.

Kata kunci: Penyakit Hati, Klasifikasi Medis, Random Forest, K-Nearest Neighbor, Deteksi Dini

References

M. Ghosh et al., “A comparative analysis of machine learning algorithms to predict liver disease,” Intell. Autom. Soft Comput., vol. 30, no. 3, pp. 917–928, 2021, doi: 10.32604/iasc.2021.017989.

V. S. Mane and S. T. Bhosale, “Machine Learning Algorithms for Detecting Liver Disease: The Review,” Int. J. Comput. Appl., vol. 185, no. 5, pp. 17–23, 2023, doi: 10.5120/ijca2023922703.

M. E. Hasan, F. Mostafa, M. S. Hossain, and J. Loftin, “Machine-Learning Classification Models to Predict Liver Cancer with Explainable AI to Discover Associated Genes,” AppliedMath, vol. 3, no. 2, pp. 417–445, 2023, doi: 10.3390/appliedmath3020022.

L. Syafa’ah, Z. Zulfatman, I. Pakaya, and M. Lestandy, “Comparison of Machine Learning Classification Methods in Hepatitis C Virus,” J. Online Inform., vol. 6, no. 1, p. 73, 2021, doi: 10.15575/join.v6i1.719.

K. Widya Kayohana, “Klasifikasi Penyakit Hati Menggunakan Random Forest Dan Knn,” JATI (Jurnal Mhs. Tek. Inform., vol. 8, no. 4, pp. 7924–7929, 2024, doi: 10.36040/jati.v8i4.10457.

S. Afrin et al., “Supervised machine learning based liver disease prediction approach with LASSO feature selection,” Bull. Electr. Eng. Informatics, vol. 10, no. 6, pp. 3369–3376, 2021, doi: 10.11591/eei.v10i6.3242.

D. I. Muhammad, E. Ermatita, and N. Falih, “Penggunaan K-Nearest Neighbor (KNN) untuk Mengklasifikasi Citra Belimbing Berdasarkan Fitur Warna,” Inform. J. Ilmu Komput., vol. 17, no. 1, p. 9, 2021, doi: 10.52958/iftk.v17i1.2132.

C. N. Prabiantissa, “Klasifikasi pada Dataset Penyakit HatiMenggunakan Algoritma Support Vector Machine, K-NN, dan Naive Bayes,” Semin. Nas. Tek. Elektro, Sist. Informasi, dan Tek. Inform., vol. 1, no. 1, pp. 263–268, 2021.

S. Aldana and J. S. Wibowo, “Penerapan Data Mining Terhadap Klasifikasi Pasien Penderita Penyakit Liver Menggunakan Metode K-Nearest Neighbor,” Progresif J. Ilm. Komput., vol. 20, no. 1, p. 124, 2024, doi: 10.35889/progresif.v20i1.1376.

T. A. Assegie, R. Subhashni, N. K. Kumar, J. P. Manivannan, P. Duraisamy, and M. F. Engidaye, “Random forest and support vector machine-based hybrid liver disease detection,” Bull. Electr. Eng. Informatics, vol. 11, no. 3, pp. 1650–1656, 2022, doi: 10.11591/eei.v11i3.3787.

N. Sharfina and N. G. Ramadhan, “Analisis SMOTE Pada Klasifikasi Hepatitis C Berbasis Random Forest dan Naïve Bayes,” JOINTECS (Journal Inf. Technol. Comput. Sci., vol. 8, no. 1, p. 33, 2023, doi: 10.31328/jointecs.v8i1.4456.

L. Zhang, Y. Huang, M. Huang, C. H. Zhao, Y. J. Zhang, and Y. Wang, “Development of Cost-Effective Fatty Liver Disease Prediction Models in a Chinese Population: Statistical and Machine Learning Approaches,” JMIR Form. Res., vol. 8, 2024, doi: 10.2196/53654.

S. Tokala et al., “Liver Disease Prediction and Classification using Machine Learning Techniques,” Int. J. Adv. Comput. Sci. Appl., vol. 14, no. 2, pp. 871–878, 2023, doi: 10.14569/IJACSA.2023.0140299.

K. Gupta, N. Jiwani, N. Afreen, and D. Divyarani, “Liver Disease Prediction using Machine learning Classification Techniques,” Proc. - 2022 IEEE 11th Int. Conf. Commun. Syst. Netw. Technol. CSNT 2022, vol. 4, no. March, pp. 221–226, 2022, doi: 10.1109/CSNT54456.2022.9787574.

O. Ahmed and R. Shiba, “Machine Learning for Classifying Liver Diseases,” Int. Integr. Intell. Syst., vol. 1, no. 1, pp. 16–21, 2024, doi: 10.21608/iiis.2024.342004.

R. Rahmadini, Enjel Erika LorencisLubis, Aji Priansyah, Yolanda R.W.N, and Tuti Meutia, “Penerapan Data Mining Untuk Memprediksi Harga Bahan Pangan Di Indonesia Menggunakan Algoritma K-Nearest Neighbor,” J. Mhs. Akunt. Samudra, vol. 4, no. 4, pp. 223–235, 2023, doi: 10.33059/jmas.v4i4.7074.

R. Pratama et al., “IMPLEMENTATION OF DIABETES PREDICTION MODEL USING RANDOM IMPLEMENTASI MODEL PREDIKSI DIABETES MENGGUNAKAN ALGORITMA,” vol. 5, no. 4, pp. 1165–1174, 2024.

Downloads

Published

2026-06-14