مدیریت اطلاعات سلامت

جایگذاری مقادیر گمشده در مجموعه داده‌های دیابت و سرطان سینه با استفاده از شبکه عصبی پرسپترون دو لایه

الهام پورجانی؛ سارا نجف‌زاده؛ نادر جعفرنیا دابانلو

دوره 18، شماره 1 ، اردیبهشت 1400، ، صفحه 1-6

https://doi.org/10.22122/him.v18i1.4194

چکیده

مقدمه: جایگذاری مقادیر گمشده در مجموعه داده‌های اطلاعاتی پزشکی، یکی از چالش‌های مهم در مسایل داده‌کاوی به شمار می‌رود. بنابراین، پژوهش حاضر با هدف جایگذاری مقادیر گمشده برخی از ویژگی‌های مجموعه داده‌های دیابت و سرطان سینه انجام شد.روش بررسی: در این مطالعه توصیفی، از مجموعه داده سرطان سینه شامل 699 نمونه که 458 نمونه خوش‌خیم و 241 ... بیشتر مقدمه: جایگذاری مقادیر گمشده در مجموعه داده‌های اطلاعاتی پزشکی، یکی از چالش‌های مهم در مسایل داده‌کاوی به شمار می‌رود. بنابراین، پژوهش حاضر با هدف جایگذاری مقادیر گمشده برخی از ویژگی‌های مجموعه داده‌های دیابت و سرطان سینه انجام شد.روش بررسی: در این مطالعه توصیفی، از مجموعه داده سرطان سینه شامل 699 نمونه که 458 نمونه خوش‌خیم و 241 نمونه بدخیم و مجموعه داده دیابت شامل 768 نمونه که 500 نمونه فاقد بیماری دیابت و 268 نمونه دیگر دارای بیماری دیابت بودند، استفاده گردید. برای جایگذاری مقادیر گمشده در این دو مجموعه داده، مدلی بر پایه شبکه عصبی پرسپترون دو لایه طراحی شد. به منظور ارزیابی، ماشین بردار پشتیبان SVM (Support Vector Machine) و آزمون t مورد استفاده قرار گرفت. یافته‌ها: میزان میانگین مربعات خطا MSE (Mean Squared Error) به دست آمده در مدل شبکه عصبی پرسپترون دو لایه در مجموعه داده دیابت، حدود 03/0 و در مجموعه داده سرطان سینه، حدود 04/0 کمتر از MSE‌های به دست آمده در روش جایگذاری با مقدار میانگین گزارش گردید. مقادیر جایگذاری شده با استفاده از مدل نسبت به مقادیر جایگذاری شده با مقدار میانگین، به مقدار واقعی نزدیک‌تر بود. صحت و حساسیت طبقه‌بندی بیماری در حالتی که مقادیر گمشده توسط شبکه عصبی پرسپترون جایگذاری شده بود، در مقایسه با دو روش مرسوم مقدار میانگین و روش حذف مقادیر گمشده در مجموعه داده دیابت به ترتیب در حدود 2، 4، 2 و 4 درصد و در مجموعه داده سرطان سینه به ترتیب در حدود 1، 3، 2، 5 درصد بیشتر شد. تفاوت معنی‌داری بین دو روش جایگذاری مقادیر گمشده با مقدار میانگین و جایگذاری مدل وجود داشت.نتیجه‌گیری: جایگذاری مقایر گمشده در مجموعه داده‌های پزشکی توسط شبکه عصبی پرسپترون دو لایه نسبت به دو روش جایگذاری با مقدار میانگین و روش حذف مقادیر گمشده، نتایج بهتری در طبقه‌بندی بیماری نشان می‌دهد.

مقالات آماده انتشار

شماره جاری

دوره 20 (1402)

دوره 19 (1401)

دوره 18 (1400)

دوره 17 (1399)

دوره 16 (1398)

دوره 15 (1397)

دوره 14 (1396)

دوره 13 (1395)

دوره 12 (1394)

دوره 11 (1393)

دوره 10 (1392)

دوره 9 (1391)

دوره 8 (1390)

دوره 7 (1389)

دوره 6 (1388)

دوره 5 (1387)

دوره 4 (1386)

دوره 3 (1385)

دوره 2 (1384)

دوره 1 (1383)

نویسنده = سارا نجف‌زاده

جایگذاری مقادیر گمشده در مجموعه داده‌های دیابت و سرطان سینه با استفاده از شبکه عصبی پرسپترون دو لایه

چکیده