نوع مقاله : مقاله پژوهشی
نویسندگان
1 دانشجوی دکتری، انفورماتیک پزشکی، گروه انفورماتیک پزشکی، دانشکده پزشکی، دانشگاه علوم پزشکی مشهد، مشهد، ایران
2 استادیار، متخصص پاتولوژی، دانشکده پزشکی، دانشگاه آزاد اسلامی، واحد زاهدان، ایران
3 دانشجوی دکتری، انفورماتیک پزشکی، گروه انفورماتیک پزشکی، دانشکده پزشکی، دانشگاه علوم پزشکی مشهد، مشهد، ایران
4 استادیار، انفورماتیک پزشکی، گروه انفورماتیک پزشکی، دانشکده پزشکی، دانشگاه علوم پزشکی مشهد، مشهد، ایران
چکیده
مقدمه: گزارش پاتولوژی به صورت متن باز تهیه میشود و شامل شبکهای از روابط بین مفاهیم پزشکی است که پزشک از آن برای استدلال و تشخیص استفاده میکند. این مطالعه با هدف، طراحی و ارزیابی مدلی جهت استخراج خودکار این مفاهیم و تبدیل آن به فرم ساختار یافته و قابل تحلیل توسط کامپیوتر انجام شد. روش بررسی: تحقیق حاضر از نوع کاربردی و اجرایی بود و بر روی 258 گزارش پاتولوژی با تشخیص بیماری سلیاک که به صورت تصادفی از دو آزمایشگاه پاتوبیولوژی جمعآوری شد، صورت گرفت. سیستم پیشنهاد شده شامل سه فاز اصلی بود. فاز اول به طراحی یک فرم استاندارد و ساختارمند برای گزارش بیوپسی بیماری سلیاک با استفاده از روش Delphi ارتباط داشت. در فاز دوم با به کارگیری ابزارهای متنکاوی ارایه شده توسط مرکز زبانشناسی دانشگاه استنفورد و برنامه واسط طراحی شده به منظور تفسیر قطعات معنایی، اطلاعات مورد نظر از متن گزارش استخراج و در قالب فرم استاندارد ذخیره گردید. در فاز سوم، کلاس Marsh مربوط به هر گزارش با استفاده از الگوریتم یادگیری درخت تصمیم 48J، به صورت خودکار تعیین شد. یافتهها: عملکرد سیستم در فاز استخراج اطلاعات و انتساب مقادیر به فیلدهای فرم استاندارد، صحت 76 درصدی را نشان داد. صحت سیستم در تعیین خودکار طبقهبندی Marsh بر اساس خروجی مرحله قبل، 62 درصد به دست آمد که در صورت ارایه دادههای تصحیح شده و بدون خطا، صحت الگوریتم دستهبندی تا 84 درصد افزایش مییابد. نتیجهگیری: در مطالعه حاضر با طراحی و پیادهسازی مدلی برای ساختارمند کردن گزارشهای پاتولوژی بیماری سلیاک، علاوه بر تسهیل و تسریع در ورود و بازیابی اطلاعات و افزایش خوانایی گزارش، امکان پردازش کامپیوتری دادهها و پیدا کردن روابط و الگوها نیز میسر گردید.
کلیدواژهها
عنوان مقاله [English]
Design and Implementation of a Structured Electronic Form for Celiac Disease Pathology Reports: A Text Mining Approach
نویسندگان [English]
- Azadeh Kamel-Ghalibaf 1
- Farzaneh Khadem-Sameni 2
- Majid Jangi 1
- Mohammad Reza Mazaheri-Habibi 3
- Kobra Etminani 4
1 PhD Candidate, Medical Informatics, Department of Medical Informatics, Mashhad University of Medical Sciences, Mashhad, Iran
2 Assistant Professor, Pathologist, School of Medicine, Zahedan Brunch, Islamic Azad University, Iran
3 PhD Candidate, Medical Informatics, Department of Medical Informatics, Mashhad University of Medical Sciences, Mashhad, Iran
4 Assistant Professor, Medical Informatics, Department of Medical Informatics, Mashhad University of Medical Sciences, Mashhad, Iran
چکیده [English]
Introduction: Pathology reports generally use an unstructured text format and contain a complex web of relations between medical concepts. In order to enable computers to understand and analyze the reports’ free text, we aimed to convert these concepts and their relations into a structured format. Methods: The training, validation, and evaluation of this implementation study was based on a corpus of 258 pathology reports with a positive diagnosis of celiac disease randomly selected from among the records of 2 pathology laboratories. Our proposed system consisted of 3 phases of standardization of celiac disease pathology reports using Delphi technique with 3 experts, information extraction from free text reports with text mining techniques using Stanford Parser, and automatic classification of celiac disease stages in marsh system using decision tree classifier J48 algorithm. Results: We were successful in extracting information from free text pathology reports and assigning each piece of information to the associated pre-defined fields in standardized template form with an accuracy of 76%. After determining marsh stage for each report in the third phase, our system showed an average overall accuracy of 62%. Evaluation of the third phase as an independent system with manually corrected, gold-standard input achieved an accuracy of greater than 84%. Conclusion: The benefits of standardized synoptic pathology reporting include enhanced completeness and improved consistency, avoidance of confusion and error, and facilitation of the faster and safer transmission of critical pathological data in comparison with narrative reports.
کلیدواژهها [English]
- Text Mining
- Celiac disease
- Decision Support Systems, Clinical
- Delphi Technique
- Decision Trees