Get a site

پایان نامه ارشد فناوری اطلاعات: استفاده از داده ­کاوی برای ارائه چارچوبی جهت کشف الگوهای پزشکی و ایجاد یک سیستم تشخیص و تصمیم و تجویز

پایان نامه ارشد فناوری اطلاعات: استفاده از داده ­کاوی برای ارائه چارچوبی جهت کشف الگوهای پزشکی و ایجاد یک سیستم تشخیص و تصمیم و تجویز

پایان نامه رشته مهندسی فناوری اطلاعات

دانشگاه قم

دانشکده فنی­ومهندسی

پایان­ نامه دوره کارشناسی ارشد مهندسی­ فناوری ­اطلاعات (IT)

عنوان:

استفاده از داده ­کاوی برای ارائه چارچوبی جهت کشف الگوهای پزشکی و ایجاد یک سیستم تشخیص، تصمیم و تجویز

مطالعه موردی: بیمارستان تخصصی کودکان حضرت فاطمه معصومه (س)

استاد راهنما:

دکتر بهروز مینایی بیدگلی

فهرست مطالب:
فصل۱: مقدمه۱
۱-۱. موضوع تحقیق۲
۱-۲. اهمیت و ضرورت تحقیق۳
۱-۳. قلمرو تحقیق.۴
۱-۴. فرضیه ­های تحقیق.۴
۱-۵. سوالات تحقیق.۵
۱-۶. اهداف و کاربردهای تحقیق۵
۱-۷. نوآوری در تحقیق۶
۱-۷-۱. موضوع و داده­های استفاده شده در تحقیق.۶
۱-۷-۲. براساس مطالعه ادبیات و نحوه ارائه مطالب.۶
۱-۸ محدودیت­های تحقیق۶
۱-۹. ساختار پایان ­نامه۷
فصل۲: ادبیات تحقیق.۸
۲-۱. مقدمه.۹
۲-۲. داده­کاوی.۹
۲-۲-۱. مفهوم داده­ کاوی.۹
۲-۲-۲. مراحل داده ­کاوی۱۰
۲-۲-۳. پیش­پردازش.۱۰
۲-۲-۳-۱. پاک­سازی داده.۱۱
۲-۲-۳-۲. یکپارچه­ سازی داده۱۱
۲-۲-۳-۳. تبدیل داده.۱۱
۲-۲-۳-۴. کاهش داده.۱۲
۲-۲-۳-۵. تصویرکردن برای کاهش بعد۱۲
۲-۲-۴. داده ­کاوی.۱۳
۲-۲-۵. پس­پردازش۱۴
۲-۲-۶. کاربردهای داده­ کاوی.۱۴
۲-۳. داده­ کاوی در پزشکی.۱۴
۲-۴. بیماری تنفسی.۱۶
۲-۴-۱. عفونت دستگاه تنفسی فوقانی۱۷
۲-۴-۲. پنومونی۱۷
۲-۴-۳. بیماری مزمن انسدادی ریه.۱۸
۲-۵. الگوریتم­های رده­بندی۱۸
۲-۵-۱. درخت تصمیم۱۹
۲-۵-۱-۱. CHAID
۲-۵-۱-۲. ID3
۲-۵-۱-۳. C5.0.
۲-۵-۲. ماشین بردار پشتیبان.۲۱
۲-۵-۳. شبکه­ عصبی۲۴
۲-۵-۴. Bagging.
۲-۵-۵. AdaBoost.
۲-۶. پیشینه تحقیقات در بیماری­های تنفسی۳۰
فصل۳: داده ­های نامتوازن.۳۲
۳-۱. مقدمه.۳۳
۳-۲. روش­های یادگیری در داده­های نامتوازن.۳۳
۳-۲-۱. نمونه­برداری۳۳
۳-۲-۱-۱. بیش­نمونه­برداری تصادفی۳۴
۳-۲-۱-۲. زیرنمونه­برداری تصادفی۳۴
۳-۲-۱-۳. نمونه­برداری آگاهانه.۳۴
۳-۲-۱-۳-۱. EasyEnsemble.
۳-۲-۱-۳-۲. ModifiedBagging
۳-۲-۱-۴. ترکیب نمونه ­برداری و تولید داده.۳۷
۳-۲-۲. روش­های حساس به هزینه.۳۹
۳-۳. معیارهای ارزیابی رده­بند در داده­ های نامتوازن.۴۱
۳-۴. معیارهای ارزیابی رده­بند در داده­ های نامتوازن و چند رده­ای۴۴
۳-۴-۱. میانگین­ گیری میکرو.۴۶
۳-۴-۲. میانگین­ گیری ماکرو۴۶
فصل۴: پیش­ پردازش داده ­ها.۴۷
۴-۱. مقدمه.۴۸
۴-۲. جمع­آوری داده­ ها.۴۸
۴-۳. ویژگی­های داده­ها۴۸
۴-۴. نحوه توزیع داده­ ها براساس ویژگی­ها۵۱
۴-۴-۱. نوع بیماری تنفسی.۵۱
۴-۴-۲. سن.۵۲
۴-۵. پیش­پردازش­های انجام شده۵۳
۴-۵-۱. حذف ویژگی­های اضافی۵۳
۴-۵-۲. حذف یا اصلاح رکورد.۵۳
۴-۵-۳. یکپارچه­سازی داده.۵۴
۴-۵-۴. تبدیل مقادیر ویژگی.۵۵
۴-۵-۴-۱. تفسیر آزمایش­های انجام شده روی بیماران۵۵
۴-۵-۴-۲. WBC (White Blood Cell).
۴-۵-۴-۳. چه چیزهایی باعث کاهش WBC می­شود؟۵۶
۴-۵-۴-۴. چه چیزهایی باعث افزایش WBC می­شود؟۵۶
۴-۵-۴-۵. جدول گسسته ­سازی WBC
۴-۵-۴-۶. RBC(Red Blood Cell).
۴-۵-۴-۷. چه چیزهایی باعث کاهش RBC می­شود؟.۵۷
۴-۵-۴-۸. چه چیزهایی باعث افزایش RBC می­شود؟.۵۸
۴-۵-۴-۹. جدول گسسته­ سازی RBC.58
۴-۵-۴-۱۰. Hb (Hemoglobin)
۴-۵-۴-۱۱. چه چیزهایی باعث کاهش هموگلوبین می­شود؟.۵۹
۴-۵-۴-۱۲. چه چیزهایی باعث افزایش هموگلوبین می­شود؟۵۹
۴-۵-۴-۱۳. جدول گسسته­ سازی هموگلوبین۵۹
۴-۵-۴-۱۴. HCT (Hematocrit).
۴-۵-۴-۱۵. چه چیزهایی باعث کاهش HCT می­شود؟.۶۰
۴-۵-۴-۱۶. چه چیزهایی باعث افزایش HCT می­شود؟.۶۰
۴-۵-۴-۱۷. جدول گسسته­ سازی HCT
۴-۵-۴-۱۸. Plt یا پلاکت­ها۶۰
۴-۵-۴-۱۹. چه چیزهایی پلاکت را کاهش می­دهد؟۶۱
۴-۵-۴-۲۰. چه چیزهایی پلاکت را افزایش می­دهد؟۶۱
۴-۵-۴-۲۱. جدول گسسته­سازی پلاکت۶۱
۴-۵-۴-۲۲. اجزای دیگر آزمایش خون۶۱
۴-۵-۴-۲۳. جدول گسسته­سازی MCV، MCH و MCHC.
۴-۵-۴-۲۴. CRP (C-Reactive Protein)
۴-۵-۴-۲۵. در چه شرایطی CRP افزایش پیدا می­ کند؟.۶۳
۴-۵-۴-۲۶. در چه شرایطی CRP کاهش پیدا می­ کند؟.۶۳
۴-۵-۴-۲۷. جدول گسسته­ سازی CRP.
۴-۵-۴-۲۸. ESR (Erythrocyte Sedimentation Rate)
۴-۵-۴-۲۹. جدول گسسته­ سازی ESR.
۴-۵-۴-۳۰. جدول گسسته­ سازی BS (Blood Suger)
۴-۵-۵. ویژگی داده­ ها پس از پیش­پردازش نهایی۶۴
۴-۶ نمونه ­برداری.۶۷
فصل۵: نتایج و یافته­ های تحقیق.۶۹
۵-۱. مقدمه.۷۰
۵-۲. رده­بندی۷۰
۵-۲-۱. مقایسه­ الگوریتم­های پایه۷۰
۵-۲-۲. مقایسه­ روش­های یادگیری در داده­ های نامتوازن.۷۴
فصل۶: نتیجه­ گیری و پیشنهادات.۷۹
۶-۱. مقدمه.۸۰
۶-۲. نتیجه ­گیری.۸۰
۶-۳. پیشنهادها۸۲
۶-۳-۱. مجموعه­ داده.۸۲
۶-۳-۲. داده­ کاوی.۸۲
مراجع۸۳
پیوست الف: واژه­ نامه انگلیسی به فارسی. ۹۲
چکیده:
بیماری تنفسی که عموما در ارتباط با بیماری ریوی است، شامل گروهی از بیماری­ها هستند که از طریق درگیر کردن بخش یا قسمت­هایی از دستگاه تنفس باعث اختلال در عملکرد ریه­ها می­گردند. ریه­ها مهم­ترین قسمت دستگاه تنفسی هستند که در عمل تبادل گازهای تنفسی جهت تامین اکسیژن بافت­های مختلف بدن و دفع دی­اکسیدکربن نقش دارند. بیماری­های ریوی در هر سال بسیاری از افراد جامعه را مبتلا می­ کنند که باعث کاهش سطح عملکرد فرد در فعالیت­های روزمره می­گردند. بیماری­های دستگاه تنفسی در انگلستان شایع­ترین عامل مراجعه به پزشکان عمومی است. میزان اختلال در عملکرد تنفس در یک بیماری ریوی به نوع بیماری و وسعت آسیب وارده بستگی دارد. بیماری­های ریوی می­توانند عفونت دستگاه تنفسی فوقانی، پنومونی و یا بیماری مزمن انسدادی ریه باشند. بیماری­های ریوی یکی از عوامل مهم مرگ­و­میر افراد در سراسر جهان هستند. فاکتور اصلی ما در این روند، تشخیص سریع و صحیح این بیماری­ها در همان ابتدای روزهای بستری است. تکنیک­های داده­کاوی می­توانند دانش نهفته در پایگاه­های داده را استخراج و در پیش­گیری، تشخیص و معالجه­ی این بیماری­ها به پزشک و بیمار کمک کنند. در این تحقیق، با مقایسه­ سیستم­های رده­بندی متفاوت و مقایسه­ روش­های یادگیری داده­های نامتوازن با الگوریتم پایه، در نهایت، سیستم رده­بندی ارائه شده که می ­تواند در تشخیص انواع بیماری­های تنفسی به پزشکان کمک کند. سرانجام، به شناسایی عوامل موثر در بروز بیماری­های تنفسی پرداخته شده است.
فصل اول: مقدمه
۱-۱- موضوع تحقیق
بیماری تنفسی[۱] که عموما در ارتباط با بیماری ریوی[۲] است، شامل گروهی از بیماری­ها هستند که از طریق درگیر کردن بخش یا قسمت­هایی از دستگاه تنفس[۳] باعث اختلال در عملکرد ریه[۴]­ها می­گردند. ریه­ها مهم­ترین قسمت دستگاه تنفسی هستند که در عمل تبادل گازهای تنفسی جهت تامین اکسیژن بافت­های مختلف بدن و دفع دی­اکسیدکربن نقش دارند. بیماری­های ریوی در هر سال بسیاری از افراد جامعه را مبتلا می­ کنند که باعث کاهش سطح عملکرد فرد در فعالیت­های روزمره می­گردند. بیماری­های دستگاه تنفسی در انگلستان شایع­ترین عامل مراجعه به پزشکان عمومی است[۱]. میزان اختلال در عملکرد تنفس در یک بیماری ریوی به نوع بیماری و وسعت آسیب وارده بستگی دارد. بیماری­های ریوی می­توانند عفونت دستگاه تنفسی فوقانی[۵]، پنومونی[۶] و یا بیماری مزمن انسدادی ریه[۷] باشند.
بیماری­های مزمن تنفسی از ۱۰ مورد بیماری­های تهدید کننده حیات در جهان هستند[۸]. مطابق آمار سازمان بهداشت جهانی[۹]، صدها میلیون نفر از جمعیت جهان از بیماری­های مزمن تنفسی رنج می­برند. پیش ­بینی می­شود تا سال ۲۰۳۰ میلادی به سومین عامل مرگ­و­میر در جهان بعد از بیماری­های قلبی­و­عروقی و سرطان­ها تبدیل گردد[۱]. فاکتور اصلی ما در این روند، تشخیص سریع و صحیح این بیماری در همان ابتدای روزهای بستری است.
تکنیک­های داده­کاوی[۱۰] علاوه بر این­که می­توانند در تشخیص سریع این بیماری­ها موثر باشند، می­توانند از طریق شناسایی عوامل موثر در بروز انواع بیماری­های تنفسی، به پیش­گیری از این بیماری­ها کمک کنند و به­ این ترتیب باعث ارتقای سلامت جامعه شده و از تحمیل هزینه­ های سنگین ناشی از تشخیص نادرست، بر بیماران جلوگیری کنند.
۱-۲. اهمیت و ضرورت تحقیق
بیماری­های مزمن تنفسی از ۱۰ مورد بیماری­های تهدید کننده حیات در جهان هستند و پیش ­بینی می­شود تا سال ۲۰۳۰ میلادی به سومین عامل مرگ­و­میر در جهان بعد از بیماری­های قلبی­و­عروقی و سرطان­ها تبدیل گردد. گرچه، گسترش تکنولوژی­های پزشکی در دهه گذشته، موجب کاهش میزان مرگ­ومیر ناشی از این بیماری شده است و به­دلیل تشخیص زودهنگام و درمان بهینه، میزان بهبودی افزایش یافته است. اما میزان بهبودی بیماران در این نوع بیماری­ها بستگی به نوع بیماری و وسعت آسیب وارده به دستگاه تنفسی دارد[۱۱]. تشخیص زودهنگام نیز به یک روش تشخیص صحیح و قابل اعتماد نیاز دارد که به پزشکان اجازه می­دهد که عفونت دستگاه تنفسی فوقانی، پنومونی و بیماری مزمن انسدادی ریه را از هم شناسایی کنند. بنابراین یافتن یک متد تشخیص صحیح و موثر و همچنین عوامل خطر در بروز این بیماری، بسیار بااهمیت است.
مشکلی که در این بیماری وجود دارد این است که در ابتدا ممکن است یک سرماخوردگی یا آنفولانزای ساده به­نظر آید. گاهی حتی به مدت زمان طولانی بیمار از این بیماری رنج می­برد. بدیهی است که در این مدت بیماری پیشرفت کرده و این تاخیر در تشخیص نوع بیماری، روند درمان را با مشکل مواجه خواهد کرد تا جایی که حتی ممکن است به مرگ بیمار منجر شود. بنابراین نیاز است تا از روش­های پیشرفته­تری برای تشخیص زودهنگام این نوع بیماری­های تنفسی استفاده شود. روش­های رایج برای تشخیص زودهنگام بیماری­های تنفسی عبارتند از: تست­های آزمایشگاهی، رادیوگرافی[۱۲] قفسه سینه، اسکن هسته­ای ریه، ام­آر­آی[۱۳]، آسپیراسیون سوزنی[۱۴] از طریق دیواره قفسه سینه. این روش­ها علاوه بر هزینه­ بالایی که بر بیمار تحمیل می­ کنند، ممکن است مضراتی را برای بیمار در پی داشته باشند. به عنوان مثال: ام­آر­آی پرهزینه و کار با آن مشکل است. موجب مشکلات برای بیماران که دارای اجسام فلزی در بدن خود می­باشند، می­شود. در ضمن بیمار در حین انجام ام­آرآی باید بی­حرکت بوده و حرکات غیرقابل پیش­گیری، مانند تنفس ضربان قلب اغلب تصویر را مخدوش می­سازد. همچنین برای بیمارانی که مشکلات تنفسی و کسانی که از محیط­های بسته می­ترسند، عبور از تونل تنگ دستگاه ام­آی­آر توصیه نمی­ شود.
این در حالی است که امروزه استفاده از سیستم­های رده­بندی[۱۵]، می­توانند به کاهش خطایی که ممکن است توسط کارشناسان کم­تجربه اتفاق بیفتد، کمک کنند و همچنین امکان بررسی داده­های پزشکی را در زمان کوتاه­تر و با جزئیات بیش­تر فراهم می­ کنند. تکنیک­های داده­ کاوی می­توانند دانش نهفته در پایگاه های داده را استخراج و در پیش­­گیری، تشخیص و معالجه­ی این بیماری به پزشک و بیمار کمک کنند.
۱-۳. قلمرو تحقیق
قلمرو مکانی: این داده ­ها مربوط به بیمارستان تخصصی کودکان حضرت فاطمه معصومه (س) استان قم می­باشد.
قلمرو زمانی: داده ­ها بین سال­های ۹۰ و ۹۲ می­باشد؛ یعنی قلمرو زمانی تحقیق به مدت ۳ سال می­باشد.
۱ Respiratory disease
۲ Lung disease
۳ Respiratory System
۴ Lunge
۵ Acute upper respiratory infections
۶ Pneumonia
۷ Chronic lower respiratory diseases
۸ http://www.salamat.gov.ir/news/
۹ World Health Organization (WHO)
۱۰ Data Mining
۱ http://fa.wikipedia.org/wiki/
۲ Radiography
۳ Magnetic Resonance Imaging (MRI)
۴ Needle Aspiration
۱ Classification
تعداد صفحه : ۱۱۲
قیمت : ۱۴۷۰۰ تومان

بلافاصله پس از پرداخت لینک دانلود فایل در اختیار شما قرار می گیرد

و در ضمن فایل خریداری شده به ایمیل شما ارسال می شود.

پشتیبانی سایت :       

****         [email protected]