نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشجوی دکتری تخصصی، انفورماتیک پزشکی، کمیته‌‌ تحقیقات دانشجویی، دانشگاه علوم پزشکی مشهد، مشهد، ایران

2 دانشجوی دکتری تخصصی، انفورماتیک پزشکی، گروه پژوهشی انفورماتیک سرطان، مرکز تحقیقات سرطان پستان جهاد دانشگاهی، تهران، ایران

3 دانشجوی دکتری تخصصی، مدیریت اطلاعات سلامت، مرکز تحقیقات علوم مدیریت و اقتصاد سلامت، دانشکده‌ی‌ مدیریت و اطلاع‌رسانی پزشکی، دانشگاه علوم پزشکی ایران، تهران، ایران

4 استادیار، انفورماتیک پزشکی، دانشکده‌ی پزشکی، دانشگاه علوم پزشکی مشهد، مشهد، ایران

چکیده

مقدمه: در دهه‌ی اخیر الگوریتم‌های یادگیری ماشین به ابزار مفیدی جهت داده‌کاوی در داده‌های پزشکی، برای تولید مدل‌های پیش‌بینی تبدیل شده‌اند. سوختگی از جمله بیماری‌هایی است که پیش‌بینی پیامد آن از اهمیت زیادی برخوردار است. هدف این مطالعه بررسی عملکرد دو الگوریتم پراستفاده‌ی یادگیری ماشین یعنی شبکه‌ی عصبی و درخت تصمیم و مقایسه با روش آماری رگرسیون لجستیک در پیش‌بینی پیامد بیماران سوختگی بوده است. روش بررسی: در این مطالعه مشاهده‌ای گذشته‌نگر، پس از انجام پردازش اولیه‌ی داده‌ها و تعیین پیامد (زنده یا فوت)، دو الگوریتم یادگیری ماشین (شبکه‌ی عصبی و درخت تصمیم) به همراه روش آماری رگرسیون لجستیک برای تولید مدل‌های پیش‌بینی روی داده‌های 4804 بیمار سوختگی بیمارستان طالقانی اهواز مربوط به سال‌های 1380 تا 1386 اعمال گردید. برای پردازش اولیه‌ی داده‌ها نرم‌افزار SPSS16 و در مرحله‌ی مدل‌سازی از Clementine 12.0 استفاده شد. همچنین با به‌کارگیری تکنیک 10-Fold Cross Validation، معیارهای ارزیابی کارایی برای داده‌های تست محاسبه و مقایسه شدند. یافته‌ها: نتایج نشان داد الگوریتم شبکه‌ی عصبی با دقت 97 درصد منجر به دقیق‌ترین مدل روی داده‌های مورد مطالعه می‌شود. مدل درخت تصمیم با دقت 95 درصد در رده‌ی دوم و مدل رگرسیون لجستیک با دقت 90 درصد کم‌ترین دقت را داشت. سایر معیارهای ارزیابی مانند حساسیت (Sensitivity)، ویژگی (Specificity)، PPV (Positive Predictive Value) و NPV (Negative Predictive Value) و AUC (Area Under the Curve) نیز کارایی مدل شبکه‌ی عصبی را بالاتر از دو مدل دیگر نشان دادند.  نتیجه‌گیری: تحلیل نتایج این مطالعه و مطالعات مشابه نشان می‌دهند که الگوریتم‌های یادگیری ماشین نسبت به روش‌های آماری منجر به تولید مدل‌های دقیق‌تری می‌شوند. بسته به ماهیت و میزان داده‌ها و همچنین جامعه‌ی پژوهش، الگوریتم‌های مختلف یادگیری ماشین، رفتارهای متفاوتی دارند که به‌نظر می‌رسد دقت مدل‌های شبکه‌ی عصبی از سایر مدل‌ها بیشتر می‌باشد. واژ‌ه‌های کلیدی: داده‌کاوی؛ یادگیری ماشین؛ پیش‌بینی؛ درخت تصمیم؛ شبکه‌ی عصبی مصنوعی؛ سوختگی‌ها 

کلیدواژه‌ها

عنوان مقاله [English]

Using Data Mining to Predict Outcome in Burn Patients: A Comparison Between Several Algorithms

نویسندگان [English]

  • Ehsan Nabovati 1
  • Amir Abas Azizi 1
  • Ebrahim Abbasi 2
  • Hassan Vakili-Arki 1
  • Javad Zarei 3
  • Amir Reza Razavi 4

1 PhD Candidate, Medical Informatics, Student Research Committee, Mashhad University of Medical Sciences, Mashhad, Iran

2 PhD Candidate, Medical Informatics, Cancer Informatics Research Group, BCRC(Breast Cancer Research Center), ACECR (Academic Center for Education, Culture and Research), Tehran, Iran

3 PhD Candidate, Health Information Management, Health Management and Economics Research Center, School of Health Management and Information Sciences, Iran University of Medical Sciences, Tehran, Iran

4 Assistant Professor, Medical Informatics, Mashhad University of Medical Sciences, Mashhad, Iran

چکیده [English]

Introduction: In the past decades, machine learning algorithms have become a useful tool for data mining within huge amounts of health data to create prediction models. Burn is one of the diseases that predicting of its outcome has high importance. The aim of this study was to survey two widely used machine learning algorithms; neural network and decision tree, and compare them with logistic regression method to predict the outcome of burn patients. Methods: In this retrospective observational study, following preprocessing of the data and determining the outcome of patient (live or death), two well-known machine learning algorithms (neural network and decision tree) and logistic regression method were used to create prediction models using data from 4804 burn patients hospitalized in Taleghani Burn Center in Ahvaz during the years 2001-2007. The preprocessing of the data was performed using SPSS (Version16.0), and in the modeling phase, Clementine (Version 12.0) software was used. Moreover, 10-fold cross validation technique was used to validate the model and criteria for evaluating the performance of models were measured and compared. Results: The results showed that the neural network algorithm with accuracy of 97% resulted the most accurate model on the studied data. The decision tree model with 95% accuracy was in the second place and the logistic regression model with an accuracy of 90% was the least accurate. Moreover other evaluating criteria such as sensitivity, specificity, PPV, NPV and AUC showed that performance of the neural network model was better than the others. Conclusion: The current study shows that machine learning algorithms compared with statistical methods create more accurate models. In analyzing the current data, the model created by artificial neural network is more accurate than the other machine learning algorithm, decision tree. Keywords: Data Mining; Machine Learning; Forecasting; Decision Tree; Artificial Neural Network; Burns

کلیدواژه‌ها [English]

  • Data Mining
  • Machine Learning
  • Forecasting
  • Decision Tree
  • Artificial Neural Network
  • Burns
  1. Olaitan PB, Olaitan JO. Burns and scalds--epidemiology and prevention in a developing country. Niger J Med. 2005; 14(1):9-16.
  2. Herndon DN, Spies M. Modern burn care. Semin Pediatr Surg. 2001; 10(1): 28-31.
  3. Badger JM. Burns: the psychological aspects. Am J Nurs. 2001; 101(11): 38-4.
  4. Afrasiabifar A, Karimi Z. Causes and materials of burning among the patients hospitalized in Yasuj Shahid Beheshti Hospital 1380. Armaghane Danesh. 2002; 7(27): 39-46. [Article in Persian]
  5. Osler T, Glance LG, Hosmer DW. Simplified estimates of the probability of death after burn injuries: extending and updating the baux score. J Trauma. 2010; 68(3): 690-7.
  6. Tobiasen J, Hiebert JM, Edlich RF. The abbreviated burn severity index. Ann Emerg Med. 1982; 11(5): 260-2.
  7. Hobbs GR. Data mining and healthcare informatics. Am J Health Behav. 2001; 25(3): 285-9.
  8. Yoo I, Alafaireet P, Marinov M, Pena-Hernandez K, Gopidi R, Chang JF, et al. Data mining in healthcare and biomedicine: a survey of the literature. J Med Syst. 2012; 36(4): 2431-48.
  9. Obenshain MK. Application of data mining techniques to healthcare data. Infect Control Hosp Epidemiol. 2004; 25(8): 690-5.
  10. Koh HC, Tan G. Data mining applications in healthcare. J Healthc Inf Manag. 2005; 19(2): 64-72.
  11. Lee TT, Liu CY, Kuo YH, Mills ME, Fong JG, Hung C. Application of data mining to the identification of critical factors in patient falls using a web-based reporting system. Int J Med Inform. 2011; 80(2): 141-50.
  12. Estahbanati HK, Bouduhi N. Role of artificial neural networks in prediction of survival of burn patients-a new approach. Burns. 2002; 28(6): 579-86.
  13. Delen D, Walker G, Kadam A. Predicting breast cancer survivability: a comparison of three data mining methods. Artif Intell Med. 2005; 34(2):113-27.
  14. Patil BM, Joshi RC, Toshniwal D, Biradar S. A new approach: role of data mining in prediction of survival of burn patients. J Med Syst. 2011; 35(6): 1531-42.
  15. Oztekin A, Delen D, Kong ZJ. Predicting the graft survival for heart-lung transplantation patients: an integrated data mining methodology. Int J Med Inform. 2009; 78(12): e84-96.
  16. Chu CM. Artificial neural network may perform good to predict the survivability of cervical cancer. AMIA Annu Symp Proc. United States. 2006; 2006: 889.
  17. Cios KJ, Pedrycz W, Swiniarski RW, Kurgan LA. Data Mining: A Knowledge Discovery Approach. USA: Springer; 2007: 473-474.
  18. Olson DL, Delen D. Advanced Data Mining Techniques. USA: Springer; 2008: 141:143.
  19. Witten IH, Frank E. Data Mining: Practical Machine Learning Tools and Techniques. USA: Esevier; 2005: 149-151.
  20. Larose DT. Discovering Knowledge in Data: An Introduction to Data Mining. Canada: John Wiley & Sons; 2005: 128:145.
  21. Clementine® 12.0 Algorithms Guide. USA: SPSS Inc.; 2007: 43-55.
  22. Shortliffe EH. Biomedical Informatics: Computer Applications in Health Care and Biomedicine. USA: Springer; 2006: 91-94.