Implementasi Algoritma Decision Tree C4.5 Untuk Prediksi Penyakit Diabetes

Noviandi Noviandi

Abstract


Abstract

Diabetes mellitus (DM) is a chronic disease that causes death. Uncontrolled, identified and unpredictable increases in blood sugar quickly lead to complications. In data mining, many have used approaches to predict the disease, one of which is the use of algortima decison tree C4.5. The motive of this study is to build a predictive model of the likelihood of diabetic patients with the C4.5 algorithm and see the akurasi of the resulting model. Prediction models are made using Pima Indians Diabetes Databases (PPID) data sourced from the UCI Machine Learning Repository. Prediction model with C4.5 decision tree algorithm has 70.32% akurasi by producing 9 rules, with the number of classes “not” as many as 4 rules and classes “yes” as many as 5 rule to predict DM disease.

Keyword: diabetes, decision tree C4.5, Accuracy                               

Abstrak

Diabetes Melitus (DM) adalah salah satu penyakit penyakit kronis yang menyebabkan kematian. Peningkatan gula darah yang tidak terkontrol, teridentifikasi dan tidak terprediksi dengan cepat mengakibatkan terjadinya komplikasi. Dalam data mining telah banyak menggunakan pendekatan-pendekatan dalam melakukan prediksi penyakit salah satu nya penggunaan algortima decison tree C4.5. Motif dari penelitian ini adalah membangun sebuah model prediksi kemungkinan diabetes pasien dengan algoritma C4.5 dan melihat akurasi dari model yang dihasilkan. Model prediksi dibuat dengan menggunakan data Pima Indians Diabetes Databases (PPID) yang bersumber dari UCI Machine Learning Repository. Model prediksi dengan algoritma decision tree C4.5 memiliki akurasi 70.32% dengan menghasilkan 9 rule, dengan jumlah class tidak sebanyak 4 rule dan 5 rule class iya untuk melakukan prediksi penyakit DM.    

Kata kunci: Diabetes, C4.5 decision tree, Akurasi

 


Full Text:

PDF

References


Perveen S, Shahbaz M, Guergachi A, Keshavjee K. Performance Analysis of Data Mining Classification Techniques to Predict Diabetes. Procedia Comput Sci [Internet]. 2016;82(March):115–21. Available from: http://dx.doi.org/10.1016/j.procs.2016.04.016

Wu H, Yang S, Huang Z, He J, Wang X. Type 2 diabetes mellitus prediction model based on data mining. Informatics Med Unlocked [Internet]. 2018;10(August 2017):100–7. Available from: https://doi.org/10.1016/j.imu.2017.12.006

Sisodia D, Sisodia DS. Prediction of Diabetes using Classification Algorithms. Procedia Comput Sci [Internet]. 2018;132(Iccids):1578–85. Available from: https://doi.org/10.1016/j.procs.2018.05.122

Rohman A, Suhartono V, Supriyanto C. Penerapan algoritma c4.5 berbasis. 2017;13:13–9.

Choubey D, Paul S, Kumar S, Kumar S. Classification of Pima indian diabetes dataset using naive bayes with genetic algorithm as an attribute selection. Commun Comput Syst [Internet]. 2017;451–5. Available from: http://www.crcnetbase.com/doi/10.1201/9781315364094-82

Santosa B, Umam A. Data Mining dan Big Data Analytics: Teori dan Implementasi Menggunakan Python & Apache Spark. 1st ed. Isa, editor. Yogyakarta: Penebar Media Pustaka; 2018.

Mochammad Yusa, Utami E, Luthfi ET. Evaluasi Performa Algoritma Klasifikasi Decision tree ID3 , C4,5 dan Cart pada Dataset Readmisi Pasien Diabetes. InfoSys J. 2016;4(1):23–34.




DOI: https://doi.org/10.47007/inohim.v6i1.142

Refbacks

  • There are currently no refbacks.


Lembaga Penerbitan Universitas Esa Unggul

Jl Arjuna Utara No 9. Tol Tomang, Kebon Jeruk, Jakarta. 11510

Email : inohim.ueu@esaunggul.ac.id

Creative Commons License

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.

View My Stats