آزاده کامل قالیباف؛ فرزانه خادم ثامنی؛ مجید جنگی؛ محمدرضا مظاهری حبیبی؛ کبری اطمینانی
دوره 13، شماره 1 ، اردیبهشت 1395، ، صفحه 19-27
چکیده
مقدمه: گزارش پاتولوژی به صورت متن باز تهیه میشود و شامل شبکهای از روابط بین مفاهیم پزشکی است که پزشک از آن برای استدلال و تشخیص استفاده میکند. این مطالعه با هدف، طراحی و ارزیابی مدلی جهت استخراج خودکار این مفاهیم و تبدیل آن به فرم ساختار یافته و قابل تحلیل توسط کامپیوتر انجام شد. روش بررسی: تحقیق حاضر از نوع کاربردی و اجرایی بود ...
بیشتر
مقدمه: گزارش پاتولوژی به صورت متن باز تهیه میشود و شامل شبکهای از روابط بین مفاهیم پزشکی است که پزشک از آن برای استدلال و تشخیص استفاده میکند. این مطالعه با هدف، طراحی و ارزیابی مدلی جهت استخراج خودکار این مفاهیم و تبدیل آن به فرم ساختار یافته و قابل تحلیل توسط کامپیوتر انجام شد. روش بررسی: تحقیق حاضر از نوع کاربردی و اجرایی بود و بر روی 258 گزارش پاتولوژی با تشخیص بیماری سلیاک که به صورت تصادفی از دو آزمایشگاه پاتوبیولوژی جمعآوری شد، صورت گرفت. سیستم پیشنهاد شده شامل سه فاز اصلی بود. فاز اول به طراحی یک فرم استاندارد و ساختارمند برای گزارش بیوپسی بیماری سلیاک با استفاده از روش Delphi ارتباط داشت. در فاز دوم با به کارگیری ابزارهای متنکاوی ارایه شده توسط مرکز زبانشناسی دانشگاه استنفورد و برنامه واسط طراحی شده به منظور تفسیر قطعات معنایی، اطلاعات مورد نظر از متن گزارش استخراج و در قالب فرم استاندارد ذخیره گردید. در فاز سوم، کلاس Marsh مربوط به هر گزارش با استفاده از الگوریتم یادگیری درخت تصمیم 48J، به صورت خودکار تعیین شد. یافتهها: عملکرد سیستم در فاز استخراج اطلاعات و انتساب مقادیر به فیلدهای فرم استاندارد، صحت 76 درصدی را نشان داد. صحت سیستم در تعیین خودکار طبقهبندی Marsh بر اساس خروجی مرحله قبل، 62 درصد به دست آمد که در صورت ارایه دادههای تصحیح شده و بدون خطا، صحت الگوریتم دستهبندی تا 84 درصد افزایش مییابد. نتیجهگیری: در مطالعه حاضر با طراحی و پیادهسازی مدلی برای ساختارمند کردن گزارشهای پاتولوژی بیماری سلیاک، علاوه بر تسهیل و تسریع در ورود و بازیابی اطلاعات و افزایش خوانایی گزارش، امکان پردازش کامپیوتری دادهها و پیدا کردن روابط و الگوها نیز میسر گردید.
احسان نبوتی؛ امیرعباس عزیزی؛ ابراهیم عباسی؛ حسن وکیلی ارکی؛ جواد زارعی؛ امیررضا رضوی
دوره 10، شماره 6 ، بهمن 1392، ، صفحه 789-799
چکیده
مقدمه: در دههی اخیر الگوریتمهای یادگیری ماشین به ابزار مفیدی جهت دادهکاوی در دادههای پزشکی، برای تولید مدلهای پیشبینی تبدیل شدهاند. سوختگی از جمله بیماریهایی است که پیشبینی پیامد آن از اهمیت زیادی برخوردار است. هدف این مطالعه بررسی عملکرد دو الگوریتم پراستفادهی یادگیری ماشین یعنی شبکهی عصبی و درخت تصمیم و مقایسه ...
بیشتر
مقدمه: در دههی اخیر الگوریتمهای یادگیری ماشین به ابزار مفیدی جهت دادهکاوی در دادههای پزشکی، برای تولید مدلهای پیشبینی تبدیل شدهاند. سوختگی از جمله بیماریهایی است که پیشبینی پیامد آن از اهمیت زیادی برخوردار است. هدف این مطالعه بررسی عملکرد دو الگوریتم پراستفادهی یادگیری ماشین یعنی شبکهی عصبی و درخت تصمیم و مقایسه با روش آماری رگرسیون لجستیک در پیشبینی پیامد بیماران سوختگی بوده است. روش بررسی: در این مطالعه مشاهدهای گذشتهنگر، پس از انجام پردازش اولیهی دادهها و تعیین پیامد (زنده یا فوت)، دو الگوریتم یادگیری ماشین (شبکهی عصبی و درخت تصمیم) به همراه روش آماری رگرسیون لجستیک برای تولید مدلهای پیشبینی روی دادههای 4804 بیمار سوختگی بیمارستان طالقانی اهواز مربوط به سالهای 1380 تا 1386 اعمال گردید. برای پردازش اولیهی دادهها نرمافزار SPSS16 و در مرحلهی مدلسازی از Clementine 12.0 استفاده شد. همچنین با بهکارگیری تکنیک 10-Fold Cross Validation، معیارهای ارزیابی کارایی برای دادههای تست محاسبه و مقایسه شدند. یافتهها: نتایج نشان داد الگوریتم شبکهی عصبی با دقت 97 درصد منجر به دقیقترین مدل روی دادههای مورد مطالعه میشود. مدل درخت تصمیم با دقت 95 درصد در ردهی دوم و مدل رگرسیون لجستیک با دقت 90 درصد کمترین دقت را داشت. سایر معیارهای ارزیابی مانند حساسیت (Sensitivity)، ویژگی (Specificity)، PPV (Positive Predictive Value) و NPV (Negative Predictive Value) و AUC (Area Under the Curve) نیز کارایی مدل شبکهی عصبی را بالاتر از دو مدل دیگر نشان دادند. نتیجهگیری: تحلیل نتایج این مطالعه و مطالعات مشابه نشان میدهند که الگوریتمهای یادگیری ماشین نسبت به روشهای آماری منجر به تولید مدلهای دقیقتری میشوند. بسته به ماهیت و میزان دادهها و همچنین جامعهی پژوهش، الگوریتمهای مختلف یادگیری ماشین، رفتارهای متفاوتی دارند که بهنظر میرسد دقت مدلهای شبکهی عصبی از سایر مدلها بیشتر میباشد. واژههای کلیدی: دادهکاوی؛ یادگیری ماشین؛ پیشبینی؛ درخت تصمیم؛ شبکهی عصبی مصنوعی؛ سوختگیها
مریم عاشوری؛ وجیهه ناجی مقدم؛ سمیه علیزاده؛ مهسا صفی
دوره 10، شماره 5 ، دی 1392، ، صفحه 739-749
چکیده
مقدمه: امروزه با شیوع بیماری دیابت پیشبینی تعداد قرص مصرفی Glibenclamid و Metformin روزانه برای بیماران به پزشکان در جهت تشخیص تعداد قرص مصرفی بیمار و همچنین مهار عوارض شدید و خطرناک مصرف بیش از حد دارو کمک مینماید، زیرا میزان نیاز بیماران دیابتی به دارو دارای اهمیت بسیار میباشد. از اینرو در پژوهش حاضر بهمنظور پیشبینی تعداد قرص مصرفی ...
بیشتر
مقدمه: امروزه با شیوع بیماری دیابت پیشبینی تعداد قرص مصرفی Glibenclamid و Metformin روزانه برای بیماران به پزشکان در جهت تشخیص تعداد قرص مصرفی بیمار و همچنین مهار عوارض شدید و خطرناک مصرف بیش از حد دارو کمک مینماید، زیرا میزان نیاز بیماران دیابتی به دارو دارای اهمیت بسیار میباشد. از اینرو در پژوهش حاضر بهمنظور پیشبینی تعداد قرص مصرفی روزانهی بیماران دیابتی، از تکنیکهای دادهکاوی استفاده شد. در پایان الگوریتمی که نتیجهی بهتری در فرآیند ارزیابی بدست میدهد، با توجه به مجموعه دادههای تحت بررسی، انتخاب میشود. روش بررسی: مطالعهی حاضر به روش توصیفی- مقطعی صورت گرفت. نمونهگیری به روش سرشماری بود و تمامی بیماران (2783 بیمار) را در فاصلهی زمانی فروردین 87 تا خرداد 91 در برگرفت. جامعهی پژوهش متشکل از دادههای مرکز تحقیقات دیابت یزد وابسته به دانشگاه علوم پزشکی شهید صدوقی یزد بود و محتوای رکوردها مورد تایید مسؤولین مرکز دیابت قرار گرفت. در مرحلهی پیش پردازش دادهها، با نظر افراد خبره در مراکز تحقیقاتی رکوردهایی که مقادیر برخی فیلدهای آنها خالی بود، حذف شد و تعداد بیماران تحت بررسی به 740 مورد رسید. این یافتهها با مراجعهی مستقیم پژوهشگر به مرکز تحقیقات دیابت یزد حاصل شده و روایی روش جمعآوری اطلاعات توسط استاد راهنما و متخصصین امر مورد تایید قرار گرفت. با سنجش صحت مجموعه دادههای آزمون، میزان پایایی دو الگوریتم مورد استفاده نیز مقایسه شد. در این مطالعه جهت تحلیل دادهها و اجرای الگوریتمهای دادهکاوی از نرمافزار Clementine 12.0 استفاده شد. دو الگوریتم متفاوت از الگوریتمهای استنتاج قانون به نامهای C5.0 و CHAID روی دادهها اعمال گردید و سپس صحت مدلهای تولید شده بدست آمد. در نهایت برای تایید صحت مدلهای تولید شده از خوشهبندی استفاده گردید. یافتهها: مقادیر بهدست آمده برای صحت مدلهای ایجاد شده از اجرای الگوریتمهای C5.0 و CHAID روی مجموعه دادههای تحت بررسی 52/45 و 38/28 درصد بود. صحت بالای مدل C5.0 عملکرد بهتر این الگوریتم برای پیشبینی تعداد قرص مصرفی را نشان داد. از طرفی پایین بودن مقدار صحت این مدل نشاندهندهی این بود که برخی مقادیر بهطور صحیح در جای خود دستهبندی نشدهاند. بنابراین مقایسهی مقادیر واقعی و مقادیر پیشبینی شده برای تعداد قرص مصرفی در تولید مدل میتواند بیانگر علل کاهش صحت هر مدل باشد. علت کاهش صحت مدل به مقادیر پیشبینی شدهای وابسته بود که در مقایسه با مقادیر واقعی صحت و ضریب اطمینان پایینی دارند. خوشهبندی نتایج بدست آمده از اجرای الگوریتم C5.0 تعداد قرص مصرفی 3، 5، 6 و 7 با صحت مقدار پیشبینی شدهی به ترتیب 83/46، 36/36، 71/55 و 15 درصد را در یک خوشه قرار داد، زیرا نمونه دادههایی که دارای صحت پایینی در پیشبینی تعداد قرص مصرفی بود و یا تعداد نمونه دادهی کمی داشت، در یک خوشه قرار گرفتند. همچنین خوشهبندی نتایج اجرای الگوریتم CHAID نیز تعداد قرص مصرفی 5 با صحت مقدار پیشبینی شدهی 93/20 را در یک خوشه قرار داد. نتیجهگیری: این مقاله حاصل پروژهی تحقیقاتی گروه دادهکاوی دانشگاه خواجه نصیر بود که در نهایت در قالب فعالیت گروهی تکمیل و بهصورت پژوهش حاضر درآمد. در مراکز تحقیقات دیابت وجود رویکرد سازماندهی شده جهت پیشبینی تعداد قرص مصرفی بیمار بهمنظور کمک به پزشک برای افزایش صحت تشخیص و جلوگیری ازعوارض جانبی ناشی از تشخیص نادرست در تعداد قرص خوراکی ضروری است. با توجه به لزوم استفاده از فنآوریهای رایانهای، اینترنت و نرمافزارهای تحلیلی و بهمنظور مهار اثرات خطرناک بیماری، بهتر است اقدامات لازم جهت ابداع رویکردهای پیشنهادی با مشاورهی متخصصان مربوط انجام شود. واژههای کلیدی: دیابت؛ درخت تصمیم؛ دستهبندی؛ خوشهبندی؛ شاخص Dunn