نوع مقاله : مقاله پژوهشی
نویسندگان
1 گروه نرم افزار، دانشکده برق و کامپیوتر، دانشگاه صنعتی اصفهان، ایران
2 گروه مهندس کامپیوتر، پردیس شهرضا، دانشگاه اصفهان، ایران
چکیده
مقدمه: شناسایی بیماران شبیه به یکدیگر بر اساس دادههای پرونده الکترونیک سلامت آنها یک مکانیسم کلیدی در طراحی بسیاری از روشهای هوشمند باهدف ارتقای کیفیت خدمات ارائهشده به بیماران و پژوهشگران است. شباهت در تشخیصهای نهایی یکی از معیارهای شباهت بیماران است. یکی از ابزارهای اصلی در تعیین تشخیصهای نهایی، پرونده الکترونیک بیمار است. بخش مهمی از پرونده الکترونیک بیمار به دادههای متنی مانند شرححال بیمار و گزارشهای مختلف اختصاص دارد که پردازش آنها به دلیل نداشتن ساختار، با چالشهایی مواجه است. بنابراین هدف مطالعه حاضر، طراحی یک مدل پردازش متنهای بالینی بهمنظور شناسایی تشخیصهای نهایی است.
روش بررسی: در این پژوهش متنهای خلاصه پرونده بیش از ۲۶۰۰۰ بیمار از پایگاه داده MIMIC-III با استفاده از روشهای هوش مصنوعی در پردازش متنهای بالینی بهصورت بردار بازنمایی شده و از این بردارها بهعنوان ورودی مدل پیشبینی کننده تشخیص استفادهشده است.
یافتهها: با توجه به نتایج آزمایشها برای معیار F1-score مدل BIO-BERT با 0.715 و سپس مدل SciBERT با 0.713 نسبت به سایر مدلها پیشتاز بودهاند. همچنین نتایج نشان میدهد استفاده از روشهای شناسایی موجودیت منجر به افزایش دقت مدل شده است.
نتیجهگیری: مدلهای بازنمایی که روی دادههای خاص زیست پزشکی آموزشدیدهاند میتوانند برای نگاشت اطلاعات نهفته متن به بردارهای ریاضی قابل استنتاج مورداستفاده قرارگرفته و امکان بهکارگیری دادههای متنی را در مسائل پیشبینی هوشمند ازجمله برای پیشبینی گروه تشخیص نهایی و پیشبینی بازگشت مجدد بیمار را فراهم آورند.
تازه های تحقیق
ناصر قدیری: Google Scholar، PubMed
کلیدواژهها
موضوعات
عنوان مقاله [English]
Patient Similarity Model Using Discharge Sheet Representation and Final Diagnosis Prediction
نویسندگان [English]
- Hoda Memarzadeh 1
- Nasser Ghadiri 1
- Maryam Lotfi shahreza 2
1 Department of Electrical and Computer Engineering, Isfahan University of Technology, Isfahan
2 Department of Computer Engineering, Shahreza Campus, University of Isfahan, Iran
چکیده [English]
Introduction: Identifying similar patients is effective in designing many secondary applications to improve the quality of treatments and research services. The similarity of the final diagnoses is one of the aspects of similar patient groups. In order to measure similarity between patients, it is crucial to convert their information into a comparable format. There are different types of data in electronic health records (EHR). An important part of patient EHR are clinical notes, which face challenges to process. Therefore, the present study aims to design a clinical language processing model to identify definitive diagnoses.
Research method: In this study, the clinical notes of more than 26,000 patients from the MIMIC-III database were represented as vectors using modern language models, and these vectors were used as input for the diagnostic prediction model.
Results: According to the results of the experiments, the BIO-BERT model with 0.715 and then the SciBERT model with 0.713 the best result between the biomedical language models. The results also show that using unique concepts extracted from clinical notes resulted in an increase in model accuracy.
Conclusion: Representation models trained with specific biomedical data can be used to map latent clinical note information to embedding vectors and provide the ability to use notes in machine learning algorithms, including prediction of the final diagnostic group.
کلیدواژهها [English]
- Natural language processing
- Health informatics
- Language model