پایان نامه ارشد فناوری اطلاعات: استفاده از داده کاوی برای ارائه چارچوبی جهت کشف الگوهای پزشکی و ایجاد یک سیستم تشخیص و تصمیم و تجویز مارس 24th, 2020 by tez Facebook پایان نامه ارشد فناوری اطلاعات: استفاده از داده کاوی برای ارائه چارچوبی جهت کشف الگوهای پزشکی و ایجاد یک سیستم تشخیص و تصمیم و تجویز پایان نامه رشته مهندسی فناوری اطلاعات دانشگاه قم دانشکده فنیومهندسی پایان نامه دوره کارشناسی ارشد مهندسی فناوری اطلاعات (IT) عنوان: استفاده از داده کاوی برای ارائه چارچوبی جهت کشف الگوهای پزشکی و ایجاد یک سیستم تشخیص، تصمیم و تجویز مطالعه موردی: بیمارستان تخصصی کودکان حضرت فاطمه معصومه (س) استاد راهنما: دکتر بهروز مینایی بیدگلی فهرست مطالب:فصل۱: مقدمه۱۱-۱. موضوع تحقیق۲۱-۲. اهمیت و ضرورت تحقیق۳۱-۳. قلمرو تحقیق.۴۱-۴. فرضیه های تحقیق.۴۱-۵. سوالات تحقیق.۵۱-۶. اهداف و کاربردهای تحقیق۵۱-۷. نوآوری در تحقیق۶۱-۷-۱. موضوع و داده های استفاده شده در تحقیق.۶۱-۷-۲. براساس مطالعه ادبیات و نحوه ارائه مطالب.۶۱-۸ محدودیتهای تحقیق۶۱-۹. ساختار پایان نامه۷فصل۲: ادبیات تحقیق.۸۲-۱. مقدمه.۹۲-۲. داده کاوی.۹۲-۲-۱. مفهوم داده کاوی.۹۲-۲-۲. مراحل داده کاوی۱۰۲-۲-۳. پیشپردازش.۱۰۲-۲-۳-۱. پاکسازی داده.۱۱۲-۲-۳-۲. یکپارچه سازی داده۱۱۲-۲-۳-۳. تبدیل داده.۱۱۲-۲-۳-۴. کاهش داده.۱۲۲-۲-۳-۵. تصویرکردن برای کاهش بعد۱۲۲-۲-۴. داده کاوی.۱۳۲-۲-۵. پسپردازش۱۴۲-۲-۶. کاربردهای داده کاوی.۱۴۲-۳. داده کاوی در پزشکی.۱۴۲-۴. بیماری تنفسی.۱۶۲-۴-۱. عفونت دستگاه تنفسی فوقانی۱۷۲-۴-۲. پنومونی۱۷۲-۴-۳. بیماری مزمن انسدادی ریه.۱۸۲-۵. الگوریتمهای ردهبندی۱۸۲-۵-۱. درخت تصمیم۱۹۲-۵-۱-۱. CHAID۲-۵-۱-۲. ID3۲-۵-۱-۳. C5.0.۲-۵-۲. ماشین بردار پشتیبان.۲۱۲-۵-۳. شبکه عصبی۲۴۲-۵-۴. Bagging.۲-۵-۵. AdaBoost.۲-۶. پیشینه تحقیقات در بیماریهای تنفسی۳۰فصل۳: داده های نامتوازن.۳۲۳-۱. مقدمه.۳۳۳-۲. روشهای یادگیری در داده های نامتوازن.۳۳۳-۲-۱. نمونهبرداری۳۳۳-۲-۱-۱. بیشنمونهبرداری تصادفی۳۴۳-۲-۱-۲. زیرنمونهبرداری تصادفی۳۴۳-۲-۱-۳. نمونهبرداری آگاهانه.۳۴۳-۲-۱-۳-۱. EasyEnsemble.۳-۲-۱-۳-۲. ModifiedBagging۳-۲-۱-۴. ترکیب نمونه برداری و تولید داده.۳۷۳-۲-۲. روشهای حساس به هزینه.۳۹۳-۳. معیارهای ارزیابی ردهبند در داده های نامتوازن.۴۱۳-۴. معیارهای ارزیابی ردهبند در داده های نامتوازن و چند ردهای۴۴۳-۴-۱. میانگین گیری میکرو.۴۶۳-۴-۲. میانگین گیری ماکرو۴۶فصل۴: پیش پردازش داده ها.۴۷۴-۱. مقدمه.۴۸۴-۲. جمعآوری داده ها.۴۸۴-۳. ویژگیهای داده ها۴۸۴-۴. نحوه توزیع داده ها براساس ویژگیها۵۱۴-۴-۱. نوع بیماری تنفسی.۵۱۴-۴-۲. سن.۵۲۴-۵. پیشپردازشهای انجام شده۵۳۴-۵-۱. حذف ویژگیهای اضافی۵۳۴-۵-۲. حذف یا اصلاح رکورد.۵۳۴-۵-۳. یکپارچهسازی داده.۵۴۴-۵-۴. تبدیل مقادیر ویژگی.۵۵۴-۵-۴-۱. تفسیر آزمایشهای انجام شده روی بیماران۵۵۴-۵-۴-۲. WBC (White Blood Cell).۴-۵-۴-۳. چه چیزهایی باعث کاهش WBC میشود؟۵۶۴-۵-۴-۴. چه چیزهایی باعث افزایش WBC میشود؟۵۶۴-۵-۴-۵. جدول گسسته سازی WBC۴-۵-۴-۶. RBC(Red Blood Cell).۴-۵-۴-۷. چه چیزهایی باعث کاهش RBC میشود؟.۵۷۴-۵-۴-۸. چه چیزهایی باعث افزایش RBC میشود؟.۵۸۴-۵-۴-۹. جدول گسسته سازی RBC.58۴-۵-۴-۱۰. Hb (Hemoglobin)۴-۵-۴-۱۱. چه چیزهایی باعث کاهش هموگلوبین میشود؟.۵۹۴-۵-۴-۱۲. چه چیزهایی باعث افزایش هموگلوبین میشود؟۵۹۴-۵-۴-۱۳. جدول گسسته سازی هموگلوبین۵۹۴-۵-۴-۱۴. HCT (Hematocrit).۴-۵-۴-۱۵. چه چیزهایی باعث کاهش HCT میشود؟.۶۰۴-۵-۴-۱۶. چه چیزهایی باعث افزایش HCT میشود؟.۶۰۴-۵-۴-۱۷. جدول گسسته سازی HCT۴-۵-۴-۱۸. Plt یا پلاکتها۶۰۴-۵-۴-۱۹. چه چیزهایی پلاکت را کاهش میدهد؟۶۱۴-۵-۴-۲۰. چه چیزهایی پلاکت را افزایش میدهد؟۶۱۴-۵-۴-۲۱. جدول گسستهسازی پلاکت۶۱۴-۵-۴-۲۲. اجزای دیگر آزمایش خون۶۱۴-۵-۴-۲۳. جدول گسستهسازی MCV، MCH و MCHC.۴-۵-۴-۲۴. CRP (C-Reactive Protein)۴-۵-۴-۲۵. در چه شرایطی CRP افزایش پیدا می کند؟.۶۳۴-۵-۴-۲۶. در چه شرایطی CRP کاهش پیدا می کند؟.۶۳۴-۵-۴-۲۷. جدول گسسته سازی CRP.۴-۵-۴-۲۸. ESR (Erythrocyte Sedimentation Rate)۴-۵-۴-۲۹. جدول گسسته سازی ESR.۴-۵-۴-۳۰. جدول گسسته سازی BS (Blood Suger)۴-۵-۵. ویژگی داده ها پس از پیشپردازش نهایی۶۴۴-۶ نمونه برداری.۶۷فصل۵: نتایج و یافته های تحقیق.۶۹۵-۱. مقدمه.۷۰۵-۲. ردهبندی۷۰۵-۲-۱. مقایسه الگوریتمهای پایه۷۰۵-۲-۲. مقایسه روشهای یادگیری در داده های نامتوازن.۷۴فصل۶: نتیجه گیری و پیشنهادات.۷۹۶-۱. مقدمه.۸۰۶-۲. نتیجه گیری.۸۰۶-۳. پیشنهادها۸۲۶-۳-۱. مجموعه داده.۸۲۶-۳-۲. داده کاوی.۸۲مراجع۸۳پیوست الف: واژه نامه انگلیسی به فارسی. ۹۲چکیده:بیماری تنفسی که عموما در ارتباط با بیماری ریوی است، شامل گروهی از بیماریها هستند که از طریق درگیر کردن بخش یا قسمتهایی از دستگاه تنفس باعث اختلال در عملکرد ریهها میگردند. ریهها مهمترین قسمت دستگاه تنفسی هستند که در عمل تبادل گازهای تنفسی جهت تامین اکسیژن بافتهای مختلف بدن و دفع دیاکسیدکربن نقش دارند. بیماریهای ریوی در هر سال بسیاری از افراد جامعه را مبتلا می کنند که باعث کاهش سطح عملکرد فرد در فعالیتهای روزمره میگردند. بیماریهای دستگاه تنفسی در انگلستان شایعترین عامل مراجعه به پزشکان عمومی است. میزان اختلال در عملکرد تنفس در یک بیماری ریوی به نوع بیماری و وسعت آسیب وارده بستگی دارد. بیماریهای ریوی میتوانند عفونت دستگاه تنفسی فوقانی، پنومونی و یا بیماری مزمن انسدادی ریه باشند. بیماریهای ریوی یکی از عوامل مهم مرگومیر افراد در سراسر جهان هستند. فاکتور اصلی ما در این روند، تشخیص سریع و صحیح این بیماریها در همان ابتدای روزهای بستری است. تکنیکهای داده کاوی میتوانند دانش نهفته در پایگاههای داده را استخراج و در پیشگیری، تشخیص و معالجهی این بیماریها به پزشک و بیمار کمک کنند. در این تحقیق، با مقایسه سیستمهای ردهبندی متفاوت و مقایسه روشهای یادگیری داده های نامتوازن با الگوریتم پایه، در نهایت، سیستم ردهبندی ارائه شده که می تواند در تشخیص انواع بیماریهای تنفسی به پزشکان کمک کند. سرانجام، به شناسایی عوامل موثر در بروز بیماریهای تنفسی پرداخته شده است.فصل اول: مقدمه۱-۱- موضوع تحقیقبیماری تنفسی[۱] که عموما در ارتباط با بیماری ریوی[۲] است، شامل گروهی از بیماریها هستند که از طریق درگیر کردن بخش یا قسمتهایی از دستگاه تنفس[۳] باعث اختلال در عملکرد ریه[۴]ها میگردند. ریهها مهمترین قسمت دستگاه تنفسی هستند که در عمل تبادل گازهای تنفسی جهت تامین اکسیژن بافتهای مختلف بدن و دفع دیاکسیدکربن نقش دارند. بیماریهای ریوی در هر سال بسیاری از افراد جامعه را مبتلا می کنند که باعث کاهش سطح عملکرد فرد در فعالیتهای روزمره میگردند. بیماریهای دستگاه تنفسی در انگلستان شایعترین عامل مراجعه به پزشکان عمومی است[۱]. میزان اختلال در عملکرد تنفس در یک بیماری ریوی به نوع بیماری و وسعت آسیب وارده بستگی دارد. بیماریهای ریوی میتوانند عفونت دستگاه تنفسی فوقانی[۵]، پنومونی[۶] و یا بیماری مزمن انسدادی ریه[۷] باشند.بیماریهای مزمن تنفسی از ۱۰ مورد بیماریهای تهدید کننده حیات در جهان هستند[۸]. مطابق آمار سازمان بهداشت جهانی[۹]، صدها میلیون نفر از جمعیت جهان از بیماریهای مزمن تنفسی رنج میبرند. پیش بینی میشود تا سال ۲۰۳۰ میلادی به سومین عامل مرگومیر در جهان بعد از بیماریهای قلبیوعروقی و سرطانها تبدیل گردد[۱]. فاکتور اصلی ما در این روند، تشخیص سریع و صحیح این بیماری در همان ابتدای روزهای بستری است.تکنیکهای داده کاوی[۱۰] علاوه بر اینکه میتوانند در تشخیص سریع این بیماریها موثر باشند، میتوانند از طریق شناسایی عوامل موثر در بروز انواع بیماریهای تنفسی، به پیشگیری از این بیماریها کمک کنند و به این ترتیب باعث ارتقای سلامت جامعه شده و از تحمیل هزینه های سنگین ناشی از تشخیص نادرست، بر بیماران جلوگیری کنند.۱-۲. اهمیت و ضرورت تحقیقبیماریهای مزمن تنفسی از ۱۰ مورد بیماریهای تهدید کننده حیات در جهان هستند و پیش بینی میشود تا سال ۲۰۳۰ میلادی به سومین عامل مرگومیر در جهان بعد از بیماریهای قلبیوعروقی و سرطانها تبدیل گردد. گرچه، گسترش تکنولوژیهای پزشکی در دهه گذشته، موجب کاهش میزان مرگومیر ناشی از این بیماری شده است و بهدلیل تشخیص زودهنگام و درمان بهینه، میزان بهبودی افزایش یافته است. اما میزان بهبودی بیماران در این نوع بیماریها بستگی به نوع بیماری و وسعت آسیب وارده به دستگاه تنفسی دارد[۱۱]. تشخیص زودهنگام نیز به یک روش تشخیص صحیح و قابل اعتماد نیاز دارد که به پزشکان اجازه میدهد که عفونت دستگاه تنفسی فوقانی، پنومونی و بیماری مزمن انسدادی ریه را از هم شناسایی کنند. بنابراین یافتن یک متد تشخیص صحیح و موثر و همچنین عوامل خطر در بروز این بیماری، بسیار بااهمیت است.مشکلی که در این بیماری وجود دارد این است که در ابتدا ممکن است یک سرماخوردگی یا آنفولانزای ساده بهنظر آید. گاهی حتی به مدت زمان طولانی بیمار از این بیماری رنج میبرد. بدیهی است که در این مدت بیماری پیشرفت کرده و این تاخیر در تشخیص نوع بیماری، روند درمان را با مشکل مواجه خواهد کرد تا جایی که حتی ممکن است به مرگ بیمار منجر شود. بنابراین نیاز است تا از روشهای پیشرفتهتری برای تشخیص زودهنگام این نوع بیماریهای تنفسی استفاده شود. روشهای رایج برای تشخیص زودهنگام بیماریهای تنفسی عبارتند از: تستهای آزمایشگاهی، رادیوگرافی[۱۲] قفسه سینه، اسکن هستهای ریه، امآرآی[۱۳]، آسپیراسیون سوزنی[۱۴] از طریق دیواره قفسه سینه. این روشها علاوه بر هزینه بالایی که بر بیمار تحمیل می کنند، ممکن است مضراتی را برای بیمار در پی داشته باشند. به عنوان مثال: امآرآی پرهزینه و کار با آن مشکل است. موجب مشکلات برای بیماران که دارای اجسام فلزی در بدن خود میباشند، میشود. در ضمن بیمار در حین انجام امآرآی باید بیحرکت بوده و حرکات غیرقابل پیشگیری، مانند تنفس ضربان قلب اغلب تصویر را مخدوش میسازد. همچنین برای بیمارانی که مشکلات تنفسی و کسانی که از محیطهای بسته میترسند، عبور از تونل تنگ دستگاه امآیآر توصیه نمی شود.این در حالی است که امروزه استفاده از سیستمهای ردهبندی[۱۵]، میتوانند به کاهش خطایی که ممکن است توسط کارشناسان کمتجربه اتفاق بیفتد، کمک کنند و همچنین امکان بررسی داده های پزشکی را در زمان کوتاهتر و با جزئیات بیشتر فراهم می کنند. تکنیکهای داده کاوی میتوانند دانش نهفته در پایگاه های داده را استخراج و در پیشگیری، تشخیص و معالجهی این بیماری به پزشک و بیمار کمک کنند.۱-۳. قلمرو تحقیققلمرو مکانی: این داده ها مربوط به بیمارستان تخصصی کودکان حضرت فاطمه معصومه (س) استان قم میباشد.قلمرو زمانی: داده ها بین سالهای ۹۰ و ۹۲ میباشد؛ یعنی قلمرو زمانی تحقیق به مدت ۳ سال میباشد.۱ Respiratory disease۲ Lung disease۳ Respiratory System۴ Lunge۵ Acute upper respiratory infections۶ Pneumonia۷ Chronic lower respiratory diseases۸ http://www.salamat.gov.ir/news/۹ World Health Organization (WHO)۱۰ Data Mining۱ http://fa.wikipedia.org/wiki/۲ Radiography۳ Magnetic Resonance Imaging (MRI)۴ Needle Aspiration۱ Classificationتعداد صفحه : ۱۱۲قیمت : ۱۴۷۰۰ تومان بلافاصله پس از پرداخت لینک دانلود فایل در اختیار شما قرار می گیرد و در ضمن فایل خریداری شده به ایمیل شما ارسال می شود. پشتیبانی سایت : * [email protected]