نوع مقاله : مقالات پژوهشی

نویسندگان

1 استادیار، کتابداری و اطلاعرسانی، دانشگاه آزاد اسلامی واحد علوم و تحقیقات تهران، تهران، ایران

2 کارشناس ارشد، کتابداری و اطلاعرسانی، دانشگاه آزاد اسلامی، واحد علوم و تحقیقات تهران، تهران، ایران.

چکیده

مقدمه: سالیان متمادی است که هستی شناسی به اشکال گوناگونی مانند طرح‌های رده‌بندی، تزاروس‌ها، واژگان کنترل شده، اصطلاح شناسی‌ها و واژهنامه‌ها معنی شده است. ازآن جا که اصطلاح‌ها و منابع دانش، اجزای مهمی از تعامل میان نظام‌های نامتجانس است، هدف این مقاله، بررسی هستی شناختی فرا اصطلاح‌نامهی نظام زبان پزشکی واحد (که در یک سیستم منفرد اصطلاحات از علوم زیست شناسی ادغام شده است و توسط کتابخانه‌ی ملی پزشکی آمریکا تهیه گردید که بخشی از زبان واحد پزشکی است) بوده است.روش بررسی: در این پژوهش با استفاده از روش مطالعه‌ی سندی و کتابخانه‌ای، به مطالعه‌ی متون و منابع موجود در زمینه‌ی مقایسه‌ی فرا اصطلاح‌نامه  Unified Medical Language Systemیا UMLS و هستی شناسی‌های دیگر (مانند  WordNetو UCO و کارهایی که در این خصوص  توسط افرادی چون  Burgunو همکار، در نتیجه‌ی بررسی و مرور منابع معتبر این حوزه و تهیه‌ی فهرستی از لغات مرتبط با علم زیست شناسی، دال بر وجود اسامی، روابط مورد نیاز در علم اطلاع‌رسانی زیست شناسی، اقدام به مطابقت آن‌ها بر اساس مفاهیم فرااصطلاح‌نامه UMLS و در نهایت تعیین وجود روابط در منابع اصلی این فرا اصطلاح‌نامه صورت گرفت) پرداخته شده است. علاوه بر این، به منظور بررسی وجود سازگاری میان نقشهی معنایی UMLS و دو هستی شناسی دیگر، مطابقت دادن در انواع معنایی UMLS و هستی شناسی سلسله مراتبی Cyc و WordNet انجام گرفت و برای ایجاد ساختاری یکپارچه در UMLS و سازگاری آن با Cyc، مفاهیم در Cyc به سه گروه تقسیم‌بندی گردید.یافته‌ها: قریب به50 مقوله از Cyc به طور دقیق برای پوشش دادن شبکه‌ی معنایی UMLS استفاده شده است. نتایج نشان داد که نزدیک به نیمی از آن‌ها در هر دو سیستم شبیه به هم هستند و میان انواع Cyc و شبکه معنایی UMLS هم‌پوشانی وجود دارد. همچنین مشخص شده است که برای بعضی از گونه‌های معنایی UMLS مقوله‌های همسان و مشابهی در نسخهی عمومی هستی شناسی سلسله مراتبی Cyc وجود ندارد. بنابراین، مقولههایی در Cyc وجود دارد که دارای هیچ گونه معادلی در UMLS نمی‌باشد. در زمینه‌ی مقایسه‌ی رده‌های معنایی UMLS و WordNet نتایج نشان داد که 2 درصد از مفاهیم ردهی اختلال سلامتی UMLS در WordNet وجود دارد که مطابقت و سازگاری میان ردهها 48 درصد بوده است.نتیجه‌گیری: هم اکنون هیچ استاندارد Upper-Level-Ontoligies در دسترس نیست. ممکن است در یک رده، مفاهیم به طور متفاوتی دسته‌بندی شوند، حتی زمانی که دسته‌بندی‌ها شبیه به هم به نظر برسند.واژه‌های کلیدی: اصطلاح شناسی؛ اصطلاح‌نامه؛ واژه نامه‌ها؛ ذخیره و بازیابی اطلاعات پزشکی.

عنوان مقاله [English]

Ontology of Unified Medical Language System (UMLS) Metathesaurus

نویسندگان [English]

  • Sedigheh Mohammadesmaeil 1
  • Laleh Samadi 2

1 Assistant Professor, Library & Information Sciences, Research and Science Branch, Azad University, Tehran, Iran

2 MSc, Library & Information Sciences, Research and Science Branch, Azad University, Tehran, Iran

چکیده [English]

Introduction: For many years, Ontologies have been available in many different forms, for example: classification schema, thesauruses, Authorized vocabularies, Terminologies and dictionaries. Terminology and knowledge resources are essential components of interoperability among disparate systems. So, this paper considered the ontology of UMLS (which was prepared by National Library Medicine of American and it is a part of Unified Medical Language System). In addition to, we evaluate whether names and relationships needed in biomedical informatics are present in the UMLS, and analyzed the compatibility between an ontology of the biomedical domain (the UMLS semantic network) and two other Ontologies : the Upper Cyc Ontology (UCO) and WordNet.Methods: In this study which has been done by the documentary and library methods (print & digital existing documentatins) about comparison between the UMLS and the other Ontologies (such as WordNet and Cyc), we try to consider the works 's like Burgun and Bodenereider, who surveyed on this field (and extracted the words which are related to the Biomedical informatics), in order to show the existence of relationships between them, as well as to determine and map them to the concept's of UMLS, and it΄s resources of it.Cyc categories that had no equivalent in the UMLS were integrated in our representation of the UMLS in order to build structure that was consistent with Cyc. They represent:Intermediate nodes, such as Primate (#$ genls Person Primate), (#$genls Primate Mammal)Generic concepts, such as simple repairing which is a super type of medical treatment event.Additional knowledge, such as biological taxon which provides information about biological categories, according to the general taxonomy of living beings.Analyzing in WordNet was held in two categories of Animal and Health disorder.Results: Roughly 50 Cyc categories were used for strictly covering the UMLS Semantic Network field. Approximately half of them were similar in both systems, for example Fish is similar in Cyc and in the UMLS. For the others, there was overlap between the Cyc and semantic network of UMLS. Thus it maps totally neither genetic function nor cell or molecular dysfunction in UMLS. Representation of anatomy differs, since elements of Cyc category Animal Body Region may be unhealthy body regions such as blisters, puncture wounds, which are abnormalities in the UMLS. In Cyc, Animal body part is a subtype of animal body region that includes both organs and body systems.For several UMLS semantic network (e.g. chemicals), there was no equivalent category in the public version of Upper Cyc Ontology. AdditionalThe set of 11,634 UMLS concepts from the ANIMAL class was mapped to WordNet, whose ANIMAL class contains 3,984 synsets. 2,154 concepts (19%) were found in WordNet, 73% of them in the WordNet ANIMAL class. The UMLS Health disorder class contains more  than 140000 concepts, which were mapped to WordNet, 2,639 UMLS concepts (2%) were found in WordNet, and among them, 1,257 concepts (48%) belonged to the WordNet health disorder class.Conclusion: There is no standard ULO available yet.within a class, concepts may be categorized differently, even when the categories look similar.Keywords: Terminology; Thesaurus; Dictionaries; Medical Information Storage & Retrieval.