TY - JOUR ID - 11233 TI - استفاده از الگوریتم های دسته بندی و خوشه بندی برای پیش بینی تعداد قرص مصرفی: مورد کاوی بیماری دیابت JO - مدیریت اطلاعات سلامت JA - HIM LA - fa SN - 1735-7853 AU - عاشوری, مریم AU - ناجی مقدم, وجیهه AU - علیزاده, سمیه AU - صفی, مهسا AD - دانشجوی کارشناسی ارشد، مهندسی فن‌آوری اطلاعات تجارت الکترونیک، دانشگاه صنعتی خواجه نصیرالدین طوسی، تهران، ایران AD - استادیار، مهندسی صنایع، دانشگاه صنعتی خواجه نصیرالدین طوسی، تهران، ایران AD - دانشجوی کارشناسی ارشد، مهندسی صنایع، دانشگاه صنعتی خواجه نصیرالدین طوسی، تهران، ایران Y1 - 2013 PY - 2013 VL - 10 IS - 5 SP - 739 EP - 749 KW - دیابت KW - درخت تصمیم KW - دسته‌بندی KW - خوشه‌بندی KW - شاخص Dunn DO - N2 - مقدمه: امروزه با شیوع بیماری دیابت پیش‌بینی تعداد قرص مصرفی Glibenclamid و Metformin روزانه برای بیماران به پزشکان در جهت تشخیص تعداد قرص مصرفی بیمار و همچنین مهار عوارض شدید و خطرناک مصرف بیش از حد دارو کمک می‌نماید، زیرا میزان نیاز بیماران دیابتی به دارو دارای اهمیت بسیار می‌باشد. از این‌رو در پژوهش حاضر به‌منظور پیش‌بینی تعداد قرص مصرفی روزانه‌ی بیماران دیابتی، از تکنیک‌های داده‌کاوی استفاده شد. در پایان الگوریتمی که نتیجه‌ی بهتری در فرآیند ارزیابی بدست می‌دهد، با توجه به مجموعه داده‌های تحت بررسی، انتخاب می‌شود. روش بررسی: مطالعه‌ی حاضر به روش توصیفی- مقطعی صورت گرفت. نمونه‌گیری به روش سرشماری بود و تمامی بیماران (2783 بیمار) را در فاصله‌ی زمانی فروردین 87 تا خرداد 91 در برگرفت. جامعه‌ی پژوهش متشکل از داده‌های مرکز تحقیقات دیابت یزد وابسته به دانشگاه علوم پزشکی شهید صدوقی یزد بود و محتوای رکوردها مورد تایید مسؤولین مرکز دیابت قرار گرفت. در مرحله‌ی پیش پردازش داده‌ها، با نظر افراد خبره در مراکز تحقیقاتی رکوردهایی که مقادیر برخی فیلدهای آنها خالی بود، حذف شد و تعداد بیماران تحت بررسی به 740 مورد رسید. این یافته‌ها با مراجعه‌ی مستقیم پژوهشگر به مرکز تحقیقات دیابت یزد حاصل شده و روایی روش جمع‌آوری اطلاعات توسط استاد راهنما و متخصصین امر مورد تایید قرار گرفت. با سنجش صحت مجموعه داده‌های آزمون، میزان پایایی دو الگوریتم مورد استفاده نیز مقایسه شد. در این مطالعه جهت تحلیل داده‌ها و اجرای الگوریتم‌های داده‌کاوی از نرم‌افزار Clementine 12.0 استفاده شد. دو الگوریتم متفاوت از الگوریتم‌های استنتاج قانون به نام‌های C5.0 و CHAID روی داده‌ها اعمال گردید و سپس صحت مدل‌های تولید شده بدست آمد. در نهایت برای تایید صحت مدل‌های تولید شده از خوشه‌بندی استفاده گردید. یافته‌ها: مقادیر به‌دست آمده برای صحت مدل‌های ایجاد شده از اجرای الگوریتم‌های C5.0 و CHAID روی مجموعه داده‌های تحت بررسی 52/45 و 38/28 درصد بود. صحت بالای مدل C5.0 عملکرد بهتر این الگوریتم برای پیش‌بینی تعداد قرص مصرفی را نشان داد. از طرفی پایین بودن مقدار صحت این مدل نشان‌دهنده‌ی این بود که برخی مقادیر به‌طور صحیح در جای خود دسته‌بندی نشده‌اند. بنابراین مقایسه‌ی مقادیر واقعی و مقادیر پیش‌بینی شده برای تعداد قرص مصرفی در تولید مدل می‌‌تواند بیانگر علل کاهش صحت هر مدل باشد. علت کاهش صحت مدل به مقادیر پیش‌بینی شده‌ای وابسته بود که در مقایسه با مقادیر واقعی صحت و ضریب اطمینان پایینی دارند. خوشه‌بندی نتایج بدست آمده از اجرای الگوریتم C5.0 تعداد قرص مصرفی 3، 5، 6 و 7 با صحت مقدار پیش‌بینی شده‌ی به ترتیب 83/46، 36/36، 71/55 و 15 درصد را در یک خوشه قرار داد، زیرا نمونه داده‌هایی که دارای صحت پایینی در پیش‌بینی تعداد قرص مصرفی بود و یا تعداد نمونه داده‌ی کمی داشت، در یک خوشه قرار گرفتند. همچنین خوشه‌بندی نتایج اجرای الگوریتم CHAID نیز تعداد قرص مصرفی 5 با صحت مقدار پیش‌بینی شده‌ی 93/20 را در یک خوشه قرار داد. نتیجه‌گیری: این مقاله حاصل پروژه‌ی تحقیقاتی گروه داده‌کاوی دانشگاه خواجه نصیر بود که در نهایت در قالب فعالیت گروهی تکمیل و به‌صورت پژوهش حاضر درآمد. در مراکز تحقیقات دیابت وجود رویکرد سازمان‌دهی شده جهت پیش‌بینی تعداد قرص مصرفی بیمار به‌منظور کمک به پزشک برای افزایش صحت تشخیص و جلوگیری ازعوارض جانبی ناشی از تشخیص نادرست در تعداد قرص خوراکی ضروری است. با توجه به لزوم استفاده از فن‌آوری‌های رایانه‌ای، اینترنت و نرم‌افزارهای تحلیلی و به‌منظور مهار اثرات خطرناک بیماری، بهتر است اقدامات لازم جهت ابداع رویکردهای پیشنهادی با مشاوره‌ی متخصصان مربوط انجام شود. واژه‌های کلیدی: دیابت؛ درخت تصمیم؛ دسته‌بندی؛ خوشه‌بندی؛ شاخص Dunn UR - https://him.mui.ac.ir/article_11233.html L1 - https://him.mui.ac.ir/article_11233_ae5ac3a967c3699a0853bf17cb482f84.pdf ER -