Implementasi Data Mining Untuk Memprediksi Penyakit Diabetes Menggunakan Algoritma Naives Bayes dan K-Nearest Neighbor

  • Fitrokh Nur Ikhromr Universitas Nusa Mandiri
  • Ipin Sugiyarto Universitas Nusa Mandiri
  • Umi Faddillah Universitas Bina Sarana Informatika
  • Bibit Sudarsono Universitas Bina Sarana Informatika

Abstract

Diabetes merupakan salah satu penyakit kronis penyebab kematian tertinggi di Indonesia berdasarkan data Riskesdas 2018 menunjukkan jumlah keseluruhan kasus penyakit diabetes yang ada di Indonesia yakni sebesar  8.5 %, meningkat dibandingkan data Riskesdas 2013 yang hanya sebesar 6.9 %. Salah satu faktor penyebab penyakit diabetes adalah obesitas yang tidak tertangani. Pada pasien Pra diabetes ditandai dengan gula darah yang naik. Permasalahan tersebut menjadi sangat penting untuk memprediksi secara dini sebagai langkah antisipasi untuk menekan kasus diabetes. Penelitian ini dilakukan dengan menggunakan metode klasifikasi dalam penggalian data untuk mencari informasi penting pasien diabetes.   Algoritma Naïve Bayes dan K-Nearest Neighbor digunakan untuk penyelesaian kasus ini. Performa algoritma Naïve Bayes dan K-Nearest Neighbor menjadi bagian evaluasi untuk mencari algortima terbaik. Hasil evaluasi,  menggunakan 2000 data pasien diabetes dengan metode K- Nearest Neighbor memiliki hasil accuracy sebesar 99% sedangkan Naïve Bayes memiliki hasil accuracy sejumlah 75%, selisih akurasi terhadap dua metode tersebut sejumlah 24%. Selanjutnya, dari hasil evaluasi uji coba model mengunakan 30 data yang dibagi menjadi data uji dan data latih, menggunakan K-Nearest  Neighbor memiliki hasil accuracy sejumlah 53%, sedangkan Naïve Bayes memiliki hasil accuracy sejumlah 66%, memiliki selisih accuracy sejumlah 13%. Dapat disimpulkan bahwa perbandingan implementasi untuk mengklasifikasikan prediksi diabetes dengan menggunakan 2000 data dan 30 data untuk uji coba model K-Nearest Neighbor dan Naïve Bayes menghasilkan accuracy yang berbeda. Pada  implementasi untuk mengklasifikasikan prediksi diabetes dengan 2000 data algoritma K- Nearest Neighbor dapat menghasilkan tingkat nilai accuracy prediksi diabetes lebih baik dibandingkan dengan memakai algoritma Naïve Bayes. sedangkan saat menggunakan data untuk uji coba model yaitu 30 data algoritma Naïve Bayes dapat menghasilkan tingkat nilai accuracy prediksi diabetes lebih baik dibandingkan dengan memakai alogoritma K-Nearest Neighbor. Berdasarkan penilaian algoritma tersebut dapat di tarik kesimpulan bahwa algoritma KNN bekerja lebih baik saat jumlah data lebih besar sedangkan sebaliknya untuk algoritma Naives Bayes memiliki hasil evaluasi tertinggi saat jumlah dataset lebih sedikit. Algoritma KNN menjadi rekomendasi terbaik dalam penggalian data besar untuk melihat pola dalam dataset 2000 record dari sumber dataset diabetes.

References

Argina, A. (2020). Penerapan Metode Klasifikasi K-Nearest Neigbor pada Dataset Penderita Penyakit Diabetes. Indonesian Journal od Data and Science, 29-33.
Argina, A. M. (2020). Penerapan Metode Klasifikasi K-Nearest Neigbor pada Dataset Penderita Penyakit Diabetes. Indonesia Jurnal Data Science, 29–33.
B., M. P. (2020). Komparasi Algoritma KNN dan Naives Bayes untuk Klasifiksi Diagnosis Penyakit Diabetes Mellitus. Journal Sain dan Manajemen, 45-57.
Bingga, I. A. (2021). Kaitan Kualitas Tidur dengan Diabetes Melitus Tipe 2. Med. Hutama, 1047–1052.
Connely, L. (2020). Logistic Regression. Medsurg Nursing: Pitman, 353.
F., K. P. (2018). Klasifikasi Diabetes Menggunakan Model Pembelajaran Ensemble Blending, ULTIMATICS, pp. 11-15.
Hendrik, N. S. (2018). Komparasi Kinerja Algoritma Data Mining pada Dataset Konsmsi Alkohol Siswa,”. Khazanah Informatika, pp. 98-103.
Hozairi Hozairi, A. A. (2021). Implementasi Orange Data Mining Untuk Klasifikasi Kelulusan Mahasiswa Dengan Model K-Nearest Neighbor, Decision Tree Serta Naive Bayes. Jurnal Ilmiah Network Engineering Research Operation, 133-144.
Joshua Neumiller, G. B. (2020). 1. Improving care and promoting health in populations: Standards of medical care in diabetes- 2020. Diabetes Care, S7–S13.
N. Maulidah, R. S. (2021). “Prediksi Penyakit Diabetes Melitus Menggunakan Metode Support Vector Machine dan Naive Bayes. Indonesian Journal of Software Engineering, pp. 63–68.
Novrizal Eka Saputra, K. D. (2016). Penerapan Knowledge Management System (KMS) Menggunakan Teknik Knowledge Data Discovery (KDD) pada PT. PLN (Persero) WS2JB Rayon Kayu Agung. Jurnal Sistem Informasi, pp. 1038-1055.
Nurdiana, N., Rodiyansyah, S. F., & Algifari, A. (2020). Studi Komparasi Algoritma ID3 dan Algoritma Naive Bayes Untuk Klasifikasi Penyakit Diabetes Mellitus. INFOTECH journal, 6(2), 18-23.
Patwari, B. A. (2021). “Komparasi Metode Klasifikasi Data Mining Decission Tree dan Naives Bayes untuk Prediksi Penyakit Diabetes,”. Infotek Jurnal Informatika Dan Teknologi, pp. 63-69.
Permadi. J., R. H. (2021). “ Perbandingan K-Nearest Neigtbor dan Backpropagation Neural Network dalam Prediksi Resiko Penyakit Diabetes Tahap Awal. Jurnal Ilmu Komputer, pp. 352-365.
Qatrunnada Refa Cahyani, M. J. (2022). Prediksi Resiko Penyakit Diabetes Menggunakan Algoritma Regressi Logistik. Journal of Machine Learning and Artificial Intelligence, pp.107-114.
Rahayu P.T., D. d. (2022). Perbandingan Algoritma K-Nearest Neighbor dan Gaussian Naives Bayes pada klasifikasi penyakit diabetes melitus. Jurnal Smart Teknologi, pp. 366-373.
Ridwan, A. (2020). Penerapan Algoritma Naïve Bayes Untuk KlasifikasiPenyakit Diabetes Mellitus. Jurnal Sistem Komputer dan Kecerdasan Buatan, pp 15-21.
Wibawa, M. S. (2018). Prediksi Penyakit Diabetes Menggunakan Algoritma ID3 dengan Pemilihan Atribut Terbaik ( Diabetes Prediction using ID3 Algorithm with Best Attribute Selection ). Juita, pp. 29–35.
Published
2023-05-29
Abstract viewed = 404 times
PDF downloaded = 453 times