نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشجوی دکتری، انفورماتیک پزشکی، گروه انفورماتیک پزشکی، دانشکده پزشکی، دانشگاه علوم پزشکی مشهد، مشهد، ایران

2 استادیار، متخصص پاتولوژی، دانشکده پزشکی، دانشگاه آزاد اسلامی، واحد زاهدان، ‏ایران

3 دانشجوی دکتری، انفورماتیک پزشکی، گروه انفورماتیک پزشکی، دانشکده پزشکی، ‏دانشگاه علوم پزشکی مشهد، مشهد، ایران

4 استادیار، انفورماتیک پزشکی، گروه انفورماتیک پزشکی، دانشکده پزشکی، دانشگاه علوم پزشکی مشهد، مشهد، ایران

چکیده

مقدمه: گزارش پاتولوژی به صورت متن باز تهیه می‌شود و شامل شبکه‌ای از روابط بین مفاهیم پزشکی است که پزشک از آن برای استدلال و تشخیص استفاده می‌کند. این مطالعه با هدف، طراحی و ارزیابی مدلی جهت استخراج خودکار این مفاهیم و تبدیل آن به فرم ساختار یافته و قابل تحلیل توسط کامپیوتر انجام شد. روش بررسی: تحقیق حاضر از نوع کاربردی و اجرایی بود و بر روی 258 گزارش پاتولوژی با تشخیص بیماری سلیاک که به صورت تصادفی از دو آزمایشگاه پاتوبیولوژی جمع‌آوری شد، صورت گرفت. سیستم پیشنهاد شده شامل سه فاز اصلی بود. فاز اول به طراحی یک فرم استاندارد و ساختارمند برای گزارش بیوپسی بیماری سلیاک با استفاده از روش Delphi ارتباط داشت. در فاز دوم با به کارگیری ابزارهای متن‌کاوی ارایه شده توسط مرکز زبان‌شناسی دانشگاه استنفورد و برنامه واسط طراحی شده به منظور تفسیر قطعات معنایی، اطلاعات مورد نظر از متن گزارش استخراج و در قالب فرم استاندارد ذخیره گردید. در فاز سوم، کلاس Marsh مربوط به هر گزارش با استفاده از الگوریتم یادگیری درخت تصمیم 48J، به صورت خودکار تعیین شد. یافته‌ها: عملکرد سیستم در فاز استخراج اطلاعات و انتساب مقادیر به فیلدهای فرم استاندارد، صحت 76 درصدی را نشان داد. صحت سیستم در تعیین خودکار طبقه‌بندی Marsh بر اساس خروجی مرحله قبل، 62 درصد به دست آمد که در صورت ارایه داده‌های تصحیح شده و بدون خطا، صحت الگوریتم دسته‌بندی تا 84 درصد افزایش می‌یابد. نتیجه‌گیری: در مطالعه حاضر با طراحی و پیاده‌سازی مدلی برای ساختارمند کردن گزارش‌های پاتولوژی بیماری سلیاک، علاوه بر تسهیل و تسریع در ورود و بازیابی اطلاعات و افزایش خوانایی گزارش، امکان پردازش کامپیوتری داده‌ها و پیدا کردن روابط و الگوها نیز میسر گردید.

کلیدواژه‌ها

عنوان مقاله [English]

Design and Implementation of a Structured Electronic Form for Celiac Disease ‎Pathology ‎Reports: A Text Mining Approach

نویسندگان [English]

  • Azadeh Kamel-Ghalibaf 1
  • Farzaneh Khadem-Sameni 2
  • Majid Jangi 1
  • Mohammad Reza Mazaheri-Habibi 3
  • Kobra Etminani 4

1 PhD Candidate, Medical Informatics, Department of Medical Informatics, Mashhad University of Medical Sciences, ‎Mashhad, Iran

2 Assistant Professor, Pathologist, School of Medicine, Zahedan Brunch, Islamic Azad University, Iran

3 PhD Candidate, Medical Informatics, Department of Medical Informatics, Mashhad University of Medical Sciences, ‎Mashhad, Iran

4 Assistant Professor, Medical Informatics, Department of Medical Informatics, Mashhad University of Medical ‎Sciences, Mashhad, ‎Iran‎

چکیده [English]

Introduction: Pathology reports generally use an unstructured text format and contain a complex web of ‎relations between medical concepts. In order to enable computers to understand and analyze ‎the reports’ free text, we aimed to convert these concepts and their relations into a structured ‎format.‎ Methods: The training, validation, and evaluation of this implementation study was based on a corpus ‎of 258 pathology reports with a positive diagnosis of celiac disease randomly selected from ‎among the records of 2 pathology laboratories. Our proposed system consisted of 3 phases of ‎standardization of celiac disease pathology reports using Delphi technique with 3 experts, ‎information extraction from free text reports with text mining techniques using Stanford ‎Parser, and automatic classification of celiac disease stages in marsh system using decision ‎tree classifier J48 algorithm.‎ Results: We were successful in extracting information from free text pathology reports and assigning ‎each piece of information to the associated pre-defined fields in standardized template form ‎with an accuracy of 76%. After determining marsh stage for each report in the third phase, ‎our system showed an average overall accuracy of 62%. Evaluation of the third phase as an ‎independent system with manually corrected, gold-standard input achieved an accuracy of ‎greater than 84%.‎ Conclusion: The benefits of standardized synoptic pathology reporting include enhanced completeness ‎and improved consistency, avoidance of confusion and error, and facilitation of the faster and ‎safer transmission of critical pathological data in comparison with narrative reports.‎

کلیدواژه‌ها [English]

  • Text Mining
  • Celiac disease
  • Decision Support Systems, Clinical
  • Delphi Technique
  • Decision ‎Trees