Implementasi Algoritma Decision Tree C4.5 Untuk Prediksi Penyakit Diabetes
Abstract
Abstract
Diabetes mellitus (DM) is a chronic disease that causes death. Uncontrolled, identified and unpredictable increases in blood sugar quickly lead to complications. In data mining, many have used approaches to predict the disease, one of which is the use of algortima decison tree C4.5. The motive of this study is to build a predictive model of the likelihood of diabetic patients with the C4.5 algorithm and see the akurasi of the resulting model. Prediction models are made using Pima Indians Diabetes Databases (PPID) data sourced from the UCI Machine Learning Repository. Prediction model with C4.5 decision tree algorithm has 70.32% akurasi by producing 9 rules, with the number of classes “not” as many as 4 rules and classes “yes” as many as 5 rule to predict DM disease.
Keyword: diabetes, decision tree C4.5, Accuracy
Abstrak
Diabetes Melitus (DM) adalah salah satu penyakit penyakit kronis yang menyebabkan kematian. Peningkatan gula darah yang tidak terkontrol, teridentifikasi dan tidak terprediksi dengan cepat mengakibatkan terjadinya komplikasi. Dalam data mining telah banyak menggunakan pendekatan-pendekatan dalam melakukan prediksi penyakit salah satu nya penggunaan algortima decison tree C4.5. Motif dari penelitian ini adalah membangun sebuah model prediksi kemungkinan diabetes pasien dengan algoritma C4.5 dan melihat akurasi dari model yang dihasilkan. Model prediksi dibuat dengan menggunakan data Pima Indians Diabetes Databases (PPID) yang bersumber dari UCI Machine Learning Repository. Model prediksi dengan algoritma decision tree C4.5 memiliki akurasi 70.32% dengan menghasilkan 9 rule, dengan jumlah class tidak sebanyak 4 rule dan 5 rule class iya untuk melakukan prediksi penyakit DM.
Kata kunci: Diabetes, C4.5 decision tree, Akurasi
Full Text:
PDFReferences
Perveen S, Shahbaz M, Guergachi A, Keshavjee K. Performance Analysis of Data Mining Classification Techniques to Predict Diabetes. Procedia Comput Sci [Internet]. 2016;82(March):115–21. Available from: http://dx.doi.org/10.1016/j.procs.2016.04.016
Wu H, Yang S, Huang Z, He J, Wang X. Type 2 diabetes mellitus prediction model based on data mining. Informatics Med Unlocked [Internet]. 2018;10(August 2017):100–7. Available from: https://doi.org/10.1016/j.imu.2017.12.006
Sisodia D, Sisodia DS. Prediction of Diabetes using Classification Algorithms. Procedia Comput Sci [Internet]. 2018;132(Iccids):1578–85. Available from: https://doi.org/10.1016/j.procs.2018.05.122
Rohman A, Suhartono V, Supriyanto C. Penerapan algoritma c4.5 berbasis. 2017;13:13–9.
Choubey D, Paul S, Kumar S, Kumar S. Classification of Pima indian diabetes dataset using naive bayes with genetic algorithm as an attribute selection. Commun Comput Syst [Internet]. 2017;451–5. Available from: http://www.crcnetbase.com/doi/10.1201/9781315364094-82
Santosa B, Umam A. Data Mining dan Big Data Analytics: Teori dan Implementasi Menggunakan Python & Apache Spark. 1st ed. Isa, editor. Yogyakarta: Penebar Media Pustaka; 2018.
Mochammad Yusa, Utami E, Luthfi ET. Evaluasi Performa Algoritma Klasifikasi Decision tree ID3 , C4,5 dan Cart pada Dataset Readmisi Pasien Diabetes. InfoSys J. 2016;4(1):23–34.
DOI: https://doi.org/10.47007/inohim.v6i1.142
Refbacks
- There are currently no refbacks.
Lembaga Penerbitan Universitas Esa Unggul
Jl Arjuna Utara No 9. Tol Tomang, Kebon Jeruk, Jakarta. 11510
Email : inohim.ueu@esaunggul.ac.id
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.
View My Stats