نوع مقاله : مقاله مروری نظام مند

نویسندگان

1 دانشجوی دکتری تخصصی، مهندسی نرم‌افزار، گروه مهندسی کامپیوتر، واحد ارومیه، دانشگاه آزاد اسلامی، ارومیه، ایران

2 استادیار، مهندسی نرم‌افزار، گروه مهندسی کامپیوتر، واحد ارومیه، دانشگاه آزاد اسلامی،ارومیه، ایران

3 استادیار، مهندسی نرم‌افزار، گروه مهندسی کامپیوتر، واحد ارومیه، دانشگاه آزاد اسلامی، ارومیه و پزشکی اجتماعی، گروه پزشکی اجتماعی، دانشکده پزشکی، دانشگاه علوم پزشکی تبریز، تبریز، ایران

چکیده

مقدمه: داده‌کاوی، ابزار کارامدی جهت آشکارسازی دانش نهفته در کلان‌‌داده‌های پزشکی می‌باشد. اولین قدم داده‌کاوی، شناخت داده و چالش‌های آن است. هدف از انجام پژوهش حاضر، بررسی سرمنشأ، تأثیرات و راهکارهای مواجهه با چالش‌های کاوش کلان‌داده‌های پزشکی و همچنین، تعیین منافع حاصل از کاوش بود.روش بررسی: در این تحقیق مروری، مطالعات انگلیسی با دو گروه کلید واژه مجزا برای مزایا و چالش‌ها از پایگاه‌‌های اطلاعاتی PubMed، ScienceDirect، Springer و Google Scholar، طی بازه زمانی سال‌های 2011 تا 2020 جستجو شد. مطالعات تک ‌منظوره حذف و مطالعاتی که به صورت جامع کاوش کلان‌داده‌های پزشکی را مورد بررسی قرار داده بودند، انتخاب شد. سپس هر چالش مورد بررسی دقیق‌تر قرار گرفت و نتایج به صورت طبقه‌بندی شده ارایه گردید.یافته‌ها: دانش حاصل از کاوش کلان‌داده پزشکی، سبب افزایش کیفیت ارایه خدمات درمانی می‌شود، اما خطا در جمع‌آوری و ثبت اطلاعات، ویژگی‌های ناشی از کلان‌داده بودن و ساختار ذاتی داده‌های پزشکی، چالش‌های بسیاری بر سر راه کاوش قرار داده است که از بین آن‌ها، «ناسازگاری، صحت، امنیت و محرمانگی داده»، دشوارترین مشکلات به شمار می‌روند. استانداردسازی و افزایش دقت و امنیت در جمع‌آوری، ذخیره‌سازی و نمایش داده‌ها، مؤثرترین راهکارهای پیشگیری می‌باشد. طراحی و استفاده از بسترها، الگوریتم‌ها و ساختارهای مناسب کلان‌داده و همچنین، بهره‌گیری از روش‌های یادگیری ماشین و هوش مصنوعی، راهکارهای مناسبی برای مواجهه با چالش‌ها محسوب می‌شوند.نتیجه‌گیری: عدم آمادگی برای ظهور کلان‌داده‌های پزشکی و رشد بسیار سریع آن‌ها، سرمنشأ بروز چالش‌هایی برای الگوریتم‌های کاوش هستند که برخی قابل پیشگیری، شناسایی و رفع می‌باشند و برخی نیز به روش‌های هوشمند نوینی نیاز دارند که قابلیت مدیریت کلان‌داده‌های پزشکی را داشته باشند.

کلیدواژه‌ها

عنوان مقاله [English]

Advantages and Challenges of Medical Big Data Mining

نویسندگان [English]

  • Leila Baradaran-Sorkhabi 1
  • Farhad Soleimanian-Gharehchopogh 2
  • Jafar Shahmfar 3

1 PhD Student, Software Engineering, Department of Computer Engineering, Urmia Branch, Islamic Azad University, Urmia, Iran

2 Assistant Professor, Software Engineering, Department of Computer Engineering, Urmia Branch, Islamic Azad University, Urmia, Iran

3 Assistant Professor, Software Engineering, Department of Computer Engineering, Urmia Branch, Islamic Azad University, Urmia AND Department of Community Medicine, Tabriz University of Medical Sciences, Tabriz, Iran

چکیده [English]

Introduction: Data mining seems to be a good tool for showing underlying knowledge of Medical Big Data (MBD). Understanding characteristics of data and possible challenges are the first steps of the journey. This study endeavors to inspect reasons, effects, and solutions of challenges as well as benefits of MBD mining.Methods: In so doing, PubMed, ScienceDirect, Springer, and Google Scholar databases were scrutinized using two groups of keywords for benefits and challenges in the years 2011-202. The search language was English. Single-purpose studies were excluded and those studies that were focused on MBD mining were included. Then, challenge was examined separately and the results were categorized.Results: Extracted knowledge from MBD enhances quality of care. However, low-quality performance in gathering and storing the data, properties of big data, and inherent structure of medical data cause many problems for mining methods. Inconsistency, veracity, privacy, and security issues are the major challenging problems. Standardization and enhancing quality of data gathering, storing, and representing tasks are the effective problem prevention strategies. Designing and using appropriate frameworks, algorithms, and structures as well as utilizing machine learning and artificial intelligence techniques are the most effective solutions for dealing with the challenges.Conclusion: MBD was appeared and expanded when the world was not ready for it. Thus, it caused many challenges for mining methods. Some of them are traceable, preventable, and manageable. However, some challenges need novel and intelligent methods that are able to handle MBD.

کلیدواژه‌ها [English]

  • Data Mining
  • Big Data
  • Health
  1. Raghupathi W, Raghupathi V. Big data analytics in healthcare: Promise and potential. Health Inf Sci Syst 2014; 2: 3.
  2. Ross MK, Wei W, Ohno-Machado L. "Big data" and the electronic health record. Yearb Med Inform 2014; 9: 97-104.
  3. Oussous A, Benjelloun FZ, Ait Lahcen A, Belfkih S. Big data technologies: A survey. Journal of King Saud University - Computer and Information Sciences 2018; 30(4): 431-48.
  4. Islam MS, Hasan MM, Wang X, Germack HD, Noor-E-Alam. A systematic review on healthcare analytics: application and theoretical perspective of data mining. Healthcare (Basel) 2018; 6(2).
  5. Pashazadeh A, Navimipour NJ. Big data handling mechanisms in the healthcare applications: A comprehensive and systematic literature review. J Biomed Inform 2018; 82: 47-62.
  6. Kruse CS, Goswamy R, Raval Y, Marawi S. Challenges and opportunities of big data in health care: A systematic review. JMIR Med Inform 2016; 4(4): e38.
  7. Lee CH, Yoon HJ. Medical big data: Promise and challenges. Kidney Res Clin Pract 2017; 36(1): 3-11.
  8. Jothi N, Rashid NA, Husain W. Data Mining in Healthcare: A Review. Procedia Comput Sci 2015; 72: 306-13.
  9. Divaris K. Fundamentals of precision medicine. Compend Contin Educ Dent 2017; 38(8 Suppl): 30-2.
  10. Chawla NV, Davis DA. Bringing big data to personalized healthcare: A patient-centered framework. J Gen Intern Med 2013; 28(Suppl 3): S660-S665.
  11. Huang L, Shea AL, Qian H, Masurkar A, Deng H, Liu D. Patient clustering improves efficiency of federated machine learning to predict mortality and hospital stay time using distributed electronic medical records. J Biomed Inform 2019; 99: 103291.
  12. Prosperi M, Min JS, Bian J, Modave F. Big data hurdles in precision medicine and precision public health. BMC Med Inform Decis Mak 2018; 18(1): 139.
  13. Viceconti M, Hunter P, Hose R. Big data, big knowledge: Big data for personalized healthcare. IEEE J Biomed Health Inform 2015; 19(4): 1209-15.
  14. Luo J, Wu M, Gopukumar D, Zhao Y. Big data application in biomedical research and health care: A literature review. Biomed Inform Insights 2016; 8: 1-10.
  15. Sun J, Reddy CK. Big data analytics for healthcare. Proceedings of the 19th ACM SIGKDD international conference on Knowledge discovery and data mining; 2013 Aug 11-14; Chicago, IL, USA.
  16. Huang BE, Mulyasasmita W, Rajagopal G. The path from big data to precision medicine. Expert Rev. Precis Med Drug Dev 2016; 1(2): 129-43.
  17. Installe AJ, Van den Bosch T, De Moor B, Timmerman D. Clinical data miner: An electronic case report form system with integrated data preprocessing and machine-learning libraries supporting clinical diagnostic model research. JMIR Med Inform 2014; 2(2): e28.
  18. Papalexakis EE, Faloutsos C. Unsupervised tensor mining for big data practitioners. Big Data 2016; 4(3): 179-91.
  19. Jeon I, Papalexakis EE, Faloutsos C, Sael L, Kang U. Mining billion-scale tensors: Algorithms and discoveries. The VLDB Journal 2016; 25(4): 519-44.
  20. Jain S, Jain K, Chodhary N. A survey paper on missing data in data mining. Int J Innov Eng Res Technol 2016; 3(12): 45-50.
  21. Bansal R, Gaur N, Singh SN. Outlier Detection: Applications and techniques in Data Mining. Proceedings of the 6th International Conference - Cloud System and Big Data Engineering; 2016 Jan 14-15; Noida, India. p. 373-7.
  22. Garc+¡a S, Luengo J, Herrera F. Tutorial on practical tips of the most influential data preprocessing algorithms in data mining. Knowl Based Syst 2016; 98: 1-29.
  23. Zhou PY, Wong AKC. Explanation and prediction of clinical data with imbalanced class distribution based on pattern discovery and disentanglement. BMC Med Inform Decis Mak 2021; 21(1): 16.
  24. Idri A, Benhar H, Fernandez-Aleman JL, Kadi I. A systematic map of medical data preprocessing in knowledge discovery. Comput Methods Programs Biomed 2018; 162: 69-85.
  25. Benhar H, Idri A, Fernandez-Aleman JL. Data preprocessing for heart disease classification: A systematic literature review. Comput Methods Programs Biomed 2020; 195: 105635.
  26. Garcia S, Ramirez -Gallego S, Luengo J, Benitez JM, Herrera F. Big data preprocessing: Methods and prospects. Big Data Analytics 2016; 1(1): 9.
  27. Giordani P, Kiers HAL. A review of tensor-based methods and their application to hospital care data. Stat Med 2018; 37(1): 137-56.
  28. Lin JH, Haug PJ. Data preparation framework for preprocessing clinical data in data mining. AMIA Annu Symp Proc 2006; 2006: 489-93.
  29. Atzmueller M, Schmidt A, Hollender M. Data preparation for big data analytics: Methods and experiences. In: Atzmueller M, Oussena S, Roth-Berghofer T, editors. Enterprise big data engineering, analytics, and management. Hershey, PA: GI Global; 2016. p. 157-70.
  30. Ortega Jn, Iturbide E, Olivares Peregrino V, Hidalgo M, Almanza N, Martinez-Rebollar A. A data preparation methodology in data mining applied to mortality population databases. J Med Syst 2015; 39: 152.
  31. Rashid A, Mohd Yasin N. Generalization technique for privacy preserving of medical information. Int J Eng Technol 2014; 6(4): 262-4.
  32. Gkoulalas-Divanis A, Loukides G, Sun J. Publishing data from electronic health records while preserving privacy: A survey of algorithms. J Biomed Inform 2014; 50: 4-19.
  33. Rajinder Sandhu, Navroop Kaur, Sandeep K. Sood, and Rajkumar Buyya. 2018. TDRM: Tensor-based data representation and mining for healthcare data in cloud computing environments. J Supercomput 2018; 74(2): 592-614.
  34. Henderson J, He H, Malin BA, Denny JC, Kho AN, Ghosh J, et al. Phenotyping through Semi-Supervised Tensor Factorization (PSST). AMIA Annu Symp Proc 2018; 2018: 564-73.
  35. Ching T, Himmelstein DS, Beaulieu-Jones BK, Kalinin AA, Do BT, Way GP, et al. Opportunities and obstacles for deep learning in biology and medicine. J R Soc Interface 2018; 15(141): 20170387.
  36. Mehta N, Pandit A. Concurrence of big data analytics and healthcare: A systematic review. Int J Med Inform 2018; 114: 57-65.