Get a site

پایان نامه ارائه مدلی برای سیستم های توصیه گر در شبکه های مبتنی بر اعتماد

پایان نامه ارائه مدلی برای سیستم های توصیه گر در شبکه های مبتنی بر اعتماد

پایان نامه رشته مهندسی فناوری اطلاعات

گرایش : مدیریت سیستم های اطلاعاتی

دانشکده آموزشهای الکترونیکی

پایان­نامه کارشناسی ارشد در رشته مهندسی فناوری اطلاعات
(مدیریت سیستم های اطلاعاتی)

 

ارائه مدلی برای سیستم­های توصیه گر در شبکه های مبتنی بر اعتماد

  

استاد راهنما :

دکتر ستار هاشمی

 

شهریور ماه ۱۳۹۲

چکیده
امروزه با گسترش و رشد روز افزون اطلاعات در فضای مجازی و وجود انبوهی از کالا یا خدماتی که در وب سایتهای تجاری و خدماتی ارائه می­گردند کاربران را با این مشکل مواجه نموده است که چگونه کالا یا خدمت مورد  نظر خود را به راحتی و با صرف کمترین زمان ممکن بیابند. در این میان سیستم های توصیه­گر با هدف تسهیل و یاری رساندن به کاربران در زمینه انتخاب و یافتن کالای مورد نیاز ایشان با بهره گرفتن از علوم و روش های مبتنی بر داده کاوی اطلاعات، ایجاد و توسعه یافته­اند. همچنین در سالهای اخیر ظهور و گسترش شبکه ­های اجتماعی و شبکه ­های مبتنی بر رابطه اعتماد میان کاربران، باعث گشوده شدن افق جدیدی در ارائه سیستم های توصیه­گر و توسعه نسل جدیدی از اینگونه سیستم ها گردیده است و آنرا به یکی از موضوعات جذاب و مورد توجه محققان تبدیل نموده است.
از میان روشها و مدل­های موجود در زمینه سیستم های توصیه­گر روش پالایش گروهی به لحاظ سادگی پیاده­سازی از محبوبیت قابل ملاحظه­ای برخوردار است اما این روش در ارائه پیشنهادات مناسب و قابل قبول به کاربران تازه وارد دارای ضعف­های جدی می­باشد. سیستم های توصیه­گر مبتنی بر اعتماد، با بهره­ گیری از رابطه اعتماد میان کاربران، در جهت رفع نقاط ضعف بیان شده و خصوصا ارائه پیشنهادات مناسب به کاربران تازه وارد گامهای موثری برداشته اند. در این تحقیق سعی شده است تا از تلفیق و ترکیب روش­های موجود در زمینه پالایش گروهی و همچنین مدلهای مبتنی بر اعتماد و بررسی نقاط ضعف و قوت آنها مدلی نوین و توسعه یافته ارائه گردد که در آن نتایج از خطای کمتر و دقت بالاتری برخوردار بوده و با افزایش معیار پوشش  بتوان به درصد بیشتری از کاربران پاسخ مناسب ارائه نمود. برای این منظور در میان انواع روش های پالایش گروهی، روش مبتنی بر آیتم و برای پیمایش شبکه اعتماد میان کاربران نیز از روش پیمایش تصادفی بهره گرفته شده است، همچنین با تفسیر و تعدیل نظرات کاربران و اتخاذ شیوه­ای مناسب جهت محاسبه مقدار دقیق اعتماد میان کاربران و تغییر در نحوه پیمایش شبکه اعتماد میان ایشان سعی در بهبود و کاهش خطاهای نتایج گردیده است. در نهایت، جهت ارزیابی و برآورد مدل ترکیبی ارائه شده، نتایج و آمارهای حاصل از اجرای مدل پیشنهادی بر روی مجموعه داده های Epinions و Movielens و مقایسه آنها با نتایج مدل پایه TrustWalkerبه عنوان یکی از بهترین مدلهای ترکیبی ارائه شده در زمینه سیستم های توصیه گر مبتنی بر اعتماد، ارائه می­گردد.

واژه­های کلیدی: داده ­کاوی[۱]، شبکه ­های اجتماعی[۲]، شبکه ­های مبتنی بر اعتماد[۳]، سیستم های توصیه­گر[۴]، پالایش گروهی[۵]، اعتماد[۶]، پیمایش تصادفی[۷]، ترکیب سازی[۸]

فهرست مطالب
 
عنوانصفحه
 
فصل اول : مقدمه­ای بر انواع سیستم توصیه­گر
       ۱-۱- مقدمه.۲
۱-۲- سیستم های توصیه­گر۳
۱-۳- انواع سیستم های توصیه­گر از لحاظ عملکردی۴
۱-۴- مزایا و اهمیت یک سیستم توصیه­گر کارآمد.۵
۱-۵- معایب و مشکلات کلی سیستم های توصیه­گر۶
۱-۶- انواع رویکردها و مدلهای موجود در زمینه پیاده­سازی سیستم های توصیه­گر.۷
۱-۷- تشریح و بیان مسئله.۱۱
۱-۸- اهداف تحقیق.۱۲
۱-۹- سوالات و فرضیه ­های تحقیق۱۳
۱-۱۰- مراحل تحقیق.۱۴
۱-۱۱- فصول پایان نامه .۱۵
 
فصل دوم : مروری بر ادبیات تحقیق و مبانی نظری تحقیق۱۷
       ۲-۱- مقدمه .۱۸
۲-۲- پالایش گروهی (Collaborative Filtering)19
۲-۲-۱- پالایش گروهی مبتنی بر حافظه(Memory Based).20
۲-۲-۱-۱- روش پالایش گروهی مبتنی بر آیتم .۲۲
۲-۲-۱-۲- امتیازدهی به صورت پیش فرض.۲۴
۲-۲-۱-۳- تشدید حالت(Case Amplification).24
۲-۲-۲- پالایش گروهی مبتنی بر مدل(Model Based)25
۲-۳- پالایش محتوایی (Content Based Filtering) .26
۲-۴- تکنیکهای ترکیبی.۲۷
۲-۵- سیستم های توصیه­گر مبتنی بر رابطه اعتماد میان کاربران.۲۸
۲-۵-۱- چگونگی کارکرد سیستم توصیه­گر مبتنی بر اعتماد۳۰
۲-۵-۲- مزایا و معایب۳۱
۲-۵-۳- انتشار اعتماد و تجمیع اعتماد.۳۳
۲-۶- چالش ها و محدودیتهای موجود.۳۳
۲-۶-۱- نقصان و کاستی اطلاعات.۳۴
۲-۶-۲- مشکل کاربران تازه وارد۳۴
۲-۶-۳- کلاهبرداری و تقلب.۳۵
۲-۶-۴- پیچیدگیهای محاسباتی و زمانی.۳۶
۲-۷- معیارهای ارزیابی سیستم های توصیه­گر.۳۷
۲-۷-۱- خطای جذر میانگین مربعات (RMSE).37
۲-۷-۲- معیار درصد پوشش.۳۸
۲-۷-۳- معیار دقت.۳۹
۲-۷-۴- معیار F-Measure.39
 
فصل سوم : مروری بر مطالعات و تحقیقات پیشین۴۱
       ۳-۱- مقدمه۴۲
۳-۲- مرور کارهای گذشته.۴۲
۳-۲-۱- مدل MoleTrust.45
۳-۲-۲- مدل TidalTrust.47
۳-۲-۳- مدل دانه سیب.۴۸
۳-۲-۴- مدل ارائه شده توسط  Anderson.48
۳-۲-۵- مدل ارائه شده توسط  O’Donovan.49
۳-۲-۶- مدل TrustWalker50
۳-۲-۶-۱- ساختار مدل TrustWalker.51
۳-۲-۶-۲- تشابه آیتم ها.۵۱
۳-۲-۶-۳- خصوصیات ویژه مدل TrustWalker.52
۳-۲-۶-۳-۱- فراگیری و عمومیت مدل.۵۲
۳-۲-۶-۳-۲- اطمینان به نتایج حاصل.۵۳
۳-۲-۶-۳-۳- تفسیرپذیری و قابل توضیح بودن نتایج۵۴
۳-۲-۶-۴- نمایش ماتریسی مدل TrustWalker54
۳-۲-۶-۵- نتیجه گیری در خصوص مدل TrustWalker.55
 
فصل چهارم : تشریح مدل ترکیبی پیشنهادی و چگونگی توسعه و بهبود مدل پایه.۵۶
       ۴-۱- مقدمه۵۷
۴-۲- تشریح مدل کلی TrustWalker.57
۴-۲-۱- علائم نشانه گذاری و متغیرهای مدل۵۷
۴-۲-۲- روند یک پیمایش تصادفی در شبکه۵۸
۴-۲-۳- انتخاب تصادفی یک کاربر ۵۹
۴-۲-۴- انتخاب یک آیتم مشابه.۵۹
۴-۲-۵- تشابه آیتم ها.۶۰
۴-۲-۶- محاسبه احتمال ماندن در یک گره شبکه اعتماد ( ).۶۱
۴-۲-۷- چگونگی انجام پیش ­بینی امتیاز۶۲
۴-۲-۸- چگونگی محاسبه احتمال .۶۳
۴-۲-۹- چگونگی محاسبه عملی ۶۴
۴-۲-۱۰- شرط اتمام کلی مدل۶۴
۴-۳- بهبود و توسعه مدل TrustWalker65
۴-۳-۱- استفاده از فرمول jaccard جهت محاسبه تشابه آیتمها۶۶
۴-۳-۲- حذف میانگین از فرمول پیرسون۶۷
۴-۳-۳- استفاده از تکنیک مبتنی بر آیتم خالص.۶۷
۴-۳-۴- تعدیل و تفسیر نظرات کاربران۶۸
۴-۳-۵- محاسبه دقیق مقدار اعتماد یا امتیاز رابطه میان دو کاربر۷۱
۴-۳-۶- محاسبه ترکیبی امتیاز رابطه میان کاربران۷۳

فصل پنجم :  تشریح روند انجام آزمایشات و نتایج حاصل۷۶
۵-۱- مقدمه۷۷
۵-۲- معرفی مجموعه داده epinions77
۵-۲-۱- ویژگیهای مجموعه داده epinions.79
۵-۲-۲- آماده سازی و نحوه پالایش داده­ ها.۸۱
۵-۲-۳- ایجاد مجموعه داده نمونه.۸۳
۵-۳- مجموعه داده movielens.84
۵-۳-۱- ویژگیهای مجموعه داده movielens.84
۵-۴- نیازمندیهای نرم افزاری.۸۵
۵-۵- نیازمندیهای سخت افزاری۸۵
۵-۶- متدولوژی نرم افزاری۸۶
۵-۷- پارامترهای پیش فرض انجام آزمایشات۸۶
۵-۸- نتایج اجرای آزمایشات با مجموعه داده epinions و movielens.87
۵-۸-۱- بررسی تاثیر عمق پیمایش بر روی نتایج حاصل در خصوص کاربران تازه وارد.۸۷
۵-۸-۲- بررسی تاثیر تاریخ اعلام نظرات توسط کاربران.۸۸
۵-۸-۳- بررسی تاثیر تغییر فرمول محاسبه تشابه آیتمها.۸۹
۵-۸-۴- بررسی تاثیر بکارگیری مکانیزم تفسیر و تعدیل نظرات کاربران۹۰
۵-۸-۵- بررسی تاثیر بکارگیری انواع روش های ترکیبی برای انتخاب کاربران و پیمایش شبکه۹۳
۵-۸-۵-۱- نحوه محاسبه امتیاز رابطه موجود میان کاربران۹۳
۵-۸-۵-۲- بررسی تاثیر بکارگیری روش های ترکیبی در عملکرد سیستم برای تمامی کاربران.۹۴
۵-۸-۵-۳- بررسی تاثیر بکارگیری روش های ترکیبی در عملکرد سیستم برای کاربران تازه وارد .۹۹
۵-۸-۶- بررسی تاثیر بکارگیری توام مکانیزم تفسیر امتیازات کاربران به همراه استفاده از روش های ترکیبی انتخاب کاربران و پیمایش شبکه اعتماد۱۰۱
۵-۹- انجام آزمایشات با مجموعه داده movielens.107
۵-۹-۱- نتایج حاصل از اجرای روش های ترکیبی مورد استفاده در مدل توسعه یافته۱۰۷

فصل ششم : نتیجه گیری نهایی و کارهای آینده۱۱۰
۶-۱- مقدمه۱۱۱
۶-۲- عملکرد مدل توسعه یافته.۱۱۲
۶-۲-۱- عملکرد مدل توسعه یافته در خصوص تمامی کاربران۱۱۲
۶-۲-۲- عملکرد مدل توسعه یافته در خصوص کاربران تازه وارد۱۱۴
۶-۳- نتیجه گیری نهایی ۱۱۵
۶-۳-۱- تحلیل نهایی نتایج حاصل از انجام آزمایشات بر روی مجموعه داده epinions116
۶-۳-۲- تحلیل نهایی نتایج حاصل از انجام آزمایشات بر روی مجموعه داده movielens118
۶-۴- پیشنهادات کارهای آینده.۱۱۸
 
اختصارات.۱۲۰
فهرست منابع.۱۲۱
فهرست جداول

عنوانصفحه

جدول ۳-۱ : دسته­بندی مدلهای اعتماد­.۴۴
جدول ۴-۱ : ماتریس پراکندگی نحوه امتیازدهی دو کاربر  و ­۷۰
جدول ۴-۲ : تفسیر نظرات کاربر ۷۰
جدول ۵-۱ : ساختار جدول reviews.­.۸۱
جدول ۵-۲ : ساختار جدول WOT­۸۲
جدول ۵-۳ : ساختار جدول  cold_start_users.­.۸۲
جدول ۵-۴ : ساختار جدول ratings­.۸۳
جدول ۵-۵ : مقادیر پیش فرض پارامترها و متغیرهای مورد استفاده در مدل پیشنهادی­.۸۶
جدول ۵-۶ : نتایج بررسی تاثیر عمق پیمایش در خصوص کاربران تازه وارد­.۸۸
جدول ۵-۷ : نتایج حاصل از بررسی تاثیر تاریخ اعلام نظرات کاربران­۸۹
جدول ۵-۸ : نتایج حاصل از تغییر فرمول محاسبه تشابه آیتمها­۹۰
جدول ۵-۹ : نتایج حاصل از بکارگیری مکانیزم تعدیل و تفسیر نظرات کاربران­.۹۱
جدول ۵-۱۰ : نتایج حاصل از بکارگیری مکانیزم تعدیل و تفسیر نظرات کاربران در خصوص کاربران تازه وارد­۹۱
جدول ۵-۱۱ : نتایج حاصل از اجرای روش های ترکیبی در مقابل روش مورد استفاده در مدل پایه­.۹۶
جدول ۵-۱۲ : نتایج حاصل از اجرای روش های ترکیبی در مقابل روش مورد استفاده در مدل پایه برای کاربران تازه وارد­۹۹
جدول ۵-۱۳ : نتایج حاصل از اجرای توام مکانیزم تعدیل و تفسیر نظر کاربران و استفاده از روش های ترکیبی پیمایش شبکه در مقابل روش مورد استفاده در مدل پایه­۱۰۲
جدول ۵-۱۴ : نتایج حاصل از اجرای توام مکانیزم تعدیل و تفسیر نظر کاربران و استفاده از روش های ترکیبی پیمایش شبکه در مقابل روش مورد استفاده در مدل پایه برای کاربران تازه وارد­۱۰۴
جدول ۵-۱۵ : نتایج حاصل از اجرای روش های ترکیبی انتخاب کاربران و پیمایش شبکه۱۰۷
جدول ۵-۱۶ : نتایج حاصل از اجرا و بکارگیری مکانیزم تعدیل و تفسیر نظرات کاربران بر روی روش های ترکیبی انتخاب کاربران و پیمایش شبکه.۱۰۸
جدول ۶-۱ : نتایج حاصل از مقایسه معیارهای ارزیابی مدل توسعه یافته در مقابل مدل پایه  .۱۱۳
جدول ۶-۲ : نتایج حاصل از مقایسه معیارهای ارزیابی مدل توسعه یافته در مقابل مدل پایه در خصوص کاربران تازه وارد.۱۱۴

فهرست اشکال و نمودارها

عنوانصفحه

شکل ۲-۱ : چگونگی کارکرد روش پالایش گروهی (Collaborative Filtering).20
شکل ۲-۲ : نمایش یک شبکه اعتماد به همراه امتیازات بیان شده توسط کاربران در خصوص آیتمهای مختلف۳۱
شکل ۳-۱ : معماری مدل MoleTrust ارائه شده توسط Massa46
شکل ۵-۱ : بنر صفحه اصلی سایت epinions.78
نمودار ۵-۱ : مقایسه نتایج خطای RMSE و درصد پوشش مدل پایه و مدل توسعه یافته در خصوص کاربران تازه وارد و تمامی کاربران با بکارگیری مکانیزم تعدیل و تفسیر نظرات کاربران   ۹۲
نمودار ۵-۲ : مقایسه نتایج معیارF-measure مدل پایه و مدل توسعه یافته در خصوص کاربران تازه وارد و تمامی کاربران با بکارگیری مکانیزم تعدیل و تفسیر نظرات کاربران۹۳
نمودار ۵-۳ : مقایسه نتایج معیاردرصد پوششحاصل از اجرای روش های ترکیبی در مقابل روش مورد استفاده در مدل پایه۹۷
نمودار ۵-۴ : مقایسه نتایج  خطای RMSEحاصل از اجرای روش های ترکیبی در مقابل روش مورد استفاده در مدل پایه۹۸
نمودار ۵-۵ : مقایسه نتایج معیار F-measureحاصل از اجرای روش های ترکیبی در مقابل روش مورد استفاده در مدل پایه.۹۸
نمودار ۵-۶ : مقایسه نتایج معیار درصد پوشش حاصل از اجرای روش های ترکیبی در مقابل روش مورد استفاده در مدل پایه برای کاربران تازه وارد.۱۰۰
نمودار ۵-۷ : مقایسه نتایج خطای RMSE حاصل از اجرای روش های ترکیبی در مقابل روش مورد استفاده در مدل پایه برای کاربران تازه وارد۱۰۰
نمودار ۵-۸ : مقایسه نتایج معیار F-measureحاصل از اجرای روش های ترکیبی در مقابل روش مورد استفاده در مدل پایه برای کاربران تازه وارد.۱۰۱
نمودار ۵-۹ : مقایسه نتایج معیار درصد پوشش حاصل از اجرای توام مکانیزم تعدیل و تفسیر نظر کاربران و استفاده از روش های ترکیبی پیمایش شبکه در مقابل روش مورد استفاده در مدل پایه۱۰۳
نمودار ۵-۱۰ : مقایسه نتایج خطای RMSE حاصل از اجرای توام مکانیزم تعدیل و تفسیر نظر کاربران و استفاده از روش های ترکیبی پیمایش شبکه در مقابل روش مورد استفاده در مدل پایه  .۱۰۳
نمودار ۵-۱۱ : مقایسه نتایج معیار F-measure حاصل از اجرای توام مکانیزم تعدیل و تفسیر نظر کاربران و استفاده از روش های ترکیبی پیمایش شبکه در مقابل روش مورد استفاده در مدل پایه۱۰۴
نمودار ۵-۱۲ : مقایسه نتایج معیار درصد پوشش حاصل از اجرای توام مکانیزم تعدیل و تفسیر نظر کاربران و استفاده از روش های ترکیبی پیمایش شبکه در مقابل روش مورد استفاده در مدل پایه برای کاربران تازه وارد.۱۰۵
نمودار ۵-۱۳ : مقایسه نتایج خطای RMSE حاصل از اجرای توام مکانیزم تعدیل و تفسیر نظر کاربران و استفاده از روش های ترکیبی پیمایش شبکه در مقابل روش مورد استفاده در مدل پایه برای کاربران تازه وارد.۱۰۶
نمودار ۵-۱۴ : مقایسه نتایج معیار F-measure حاصل از اجرای توام مکانیزم تعدیل و تفسیر نظر کاربران و استفاده از روش های ترکیبی پیمایش شبکه در مقابل روش مورد استفاده در مدل پایه برای کاربران تازه وارد.۱۰۶
نمودار ۵-۱۵ : مقایسه نتایج خطای RMSE حاصل از اجرا و بکارگیری مکانیزم تعدیل و تفسیر نظرات کاربران بر روی روش های ترکیبی انتخاب کاربران و پیمایش شبکه۱۰۹
نمودار ۶-۱ : مقایسه عملکرد کلی مدل توسعه یافته در مقابل مدل پایه از نظر تمام معیارهای ارزیابی۱۱۳
نمودار ۶-۲ : مقایسه عملکرد کلی مدل توسعه یافته در مقابل مدل پایه برای کاربران تازه وارد از نظر تمام معیارهای ارزیابی۱۱۵

[۱] Data Mining
[۲] Social Networks
[۳] Trust Networks
[۴] Recommender Systems
[۵] Collaborative Filtering(CF)
[۶] Trust
[۷] Random Walk
[۸] Hybridization
مقدمه

گسترش سریع و روز افزون اطلاعات ارائه شده بر روی شبکه جهانی اینترنت، کاربران را با مشکلات عدیده و قابل تاملی در خصوص انتخاب منابع و اطلاعات مورد نیاز ایشان مواجه نموده است و چه بسا که بدون راهنمایی و هدایت صحیح، کاربران در اخذ تصمیمات صحیح یا انتخاب کالا و خدمات مورد نیازشان دچار اشتباه شده که این امر تبعات عدیده­ای از جمله نارضایتی، سلب اطمینان کاربران و مشتریان سایتهای موجود بر روی اینترنت را به همراه خواهد داشت. از اینرو وجود ابزار و سیستمهایی برای کمک به کاربران در انتخاب اطلاعات مناسب و مورد نیاز ایشان کاملا ضروری به نظر می­رسد. در سالهای اخیر برای برآورده سازی این نیازها سیستم های توصیه­گرمطرح و توسعه یافته­اند و الگوریتمها ، مقالات و متون علمی بسیار متنوع و مختلفی در این زمینه مطرح گردیده است .
در این میان، ایجاد و گسترش شبکه ­های اجتماعی، شبکه ­های اعتماد و وجود انواع روابط میان کاربران این شبکه­ها افق جدیدی را برروی محققان و توسعه دهندگان سیستم های توصیه­گر گشوده است تا با بهره­ گیری از علوم اجتماعی و علوم روان شناختی حاکم در این شبکه­ها و خصوصا وجود رابطه اعتماد میان کاربران بتوانند نسل جدیدی از سیستم های توصیه­گر را تحت عنوان “سیستم های توصیه­گر مبتنی بر اعتماد[۱]”معرفی و عرضه نمایند. این سیستم ها قادر هستند تا به درصد بیشتری از کاربران پاسخ مناسب را ارائه دهند و همچنین نتایج آنها از دقت بالاتری برخوردار می­باشد.
با توجه به کثرت کاربران و افراد عضو شبکه ­های مبتنی بر اعتماد و شبکه ­های اجتماعی، همچنین تنوع رفتار و ویژگی­های ایشان، تنها یک شیوه یا یک مدل قادر به پاسخگویی و ارائه پیشنهادات دقیق و قابل قبول نمی­باشد که این امر باعث ظهور سیستم های توصیه­گر ترکیبی[۲]گردیده است. در این سیستم ها سعی شده است تا با ترکیب انواع مختلفی از سیستم های توصیه­گر بتوان سیستمی تولید نمود که دارای مزایای حداکثری و معایب حداقلی باشد.
در این پایان ­نامه سعی شده است تا با تغییر، اصلاح، تلفیق و ترکیب تعدادی از روشها و الگوریتم­های مطرح و قابل قبول در سطح جهانی، مدلی ارائه گردد که نسبت به مدل­های پیشین دارای دقت و درصد پوشش بالاتری باشد و همچنین بتواند نقایص مدلهای پیشین خصوصا در رابطه با ارائه پیشنهاد به کاربران تازه وارد[۳] را تا حد قابل قبولی مرتفع نماید.
[۱] Trust-Based Recommendation Systems(TBRS)
[۲] Hybrid Recommender System
[۳] Cold Start Users
تعداد صفحه : ۱۵۵
قیمت : ۱۴۷۰۰ تومان

بلافاصله پس از پرداخت لینک دانلود فایل در اختیار شما قرار می گیرد

و در ضمن فایل خریداری شده به ایمیل شما ارسال می شود.

پشتیبانی سایت :        *       [email protected]

در صورتی که مشکلی با پرداخت آنلاین دارید می توانید مبلغ مورد نظر برای هر فایل را کارت به کارت کرده و فایل درخواستی و اطلاعات واریز را به ایمیل ما ارسال کنید تا فایل را از طریق ایمیل دریافت کنید.

  *