دوره 12، شماره 1، 1394 ( شماره پیاپی 41):48-60

تشخيص خودکار شاخه موضوعي اصطلاحات MeSH با محاسبه بسامد رخداد آن ها در MEDLINE

محمد توکلي زاده راوري, سعيد غفاري, فروغ مصطفوي

چکیده


مقدمه: تحت تاثير پويايي اصطلاحات تخصصي، امروزه طبقه بندي موضوعات پيچيده تر شده است زيرا هر مدرک مي تواند در چند طبقه موضوعي جاي بگيرد. بر اين اساس، پژوهش حاضر با هدف تعيين کارآمدي روش تشخيص خودکار شاخه اصلي اصطلاحاتMeSH از طريق محاسبه نسبت فراواني آن‌ها در دسته مدارک مرتبط وغير مرتبط انجام شد.

روش بررسي: روش پژوهش توصيفي، با استفاده از تحليل اسنادي و نوع آن کاربردي است. در تير ماه 1391 شمسي از MeSH و پايگاه PubMed به عنوان منابع گردآوري اطلاعات بهره گرفته شد. اعتبار اين منابع، روا بودن بهره گيري از آن‌ها را  تائيد مي‌کند. تعداد 18164 اصطلاح MeSH و 163226 مدرک از PubMedبرگزيده شد. در گزينش آن ها، هيچ محدوديت زماني اعمال نشد. اين تعداد، از حجم نمونه به روش کوکران بالاتر بود. با جستجو در PubMed، يازده دسته مدرک حاصل شد. نسبت حضور هر اصطلاح در اين دسته ها محاسبه و نتيجه با شاخه واقعي آن در درخت MeSH مقايسه شد. شاخه اصلي يک درصد از اين اصطلاحات توسط متخصصان پزشکي نيز پيش بيني گرديد. براي بررسي داده ها، از روش توزيع فراواني و آزمون‌هايT و Chi-Squar بهره گرفته  شد. تحلیل داده‌ها با نرم‌افزارSPSS  صورت گرفت.

يافته ها: مدارکPubMed به طور متوسط به سه شاخه مربوط بودند و غالب اصطلاحات در تمامي دسته‌ها حضور داشتند. مشخص شد که روش پيشنهادي، احتمال تشخيص منطبق با ساختار درخت موضوعيMeSH را افزايش مي دهد و کارآمدي آن بسته به شاخه موضوعي، بين 3 تا 67 درصد متفاوت است. پيش‌بيني متخصصان پزشکي درباره شاخه موضوعي هر اصطلاح، به طور معناداري با ساختار MeSHمنطبق بود.

نتيجه گيري: سطح انطباق تشخيص طبقه موضوعات به روش‌هاي عيني و ذهني در حوزه هاي گوناگون فرق مي‌کند. از آن جا که طبقه بندي هاي ذهني کاري  کاملا  ادراکي و مربوط به تجربه هاي بيروني بشري است، مدل هاي ماشيني نمي توانند دقيقا آن فرآيند را مشابه سازي کنند.


واژگان کلیدی


طبقه بندی؛ پردازش خودکار داده ها؛ تشخيص خودکار الگو؛ سرعنوان هاي موضوعي پزشکي؛ مدلاين؛ نمايه سازی و چکيده نويسی به عنوان موضوع.

تمام متن:

PDFCreative Commons Attribution-NonCommercial 4.0

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 Unported License which allows users to read, copy, distribute and make derivative works for non-commercial purposes from the material, as long as the author of the original work is cited properly.