پایان نامه ارشد نرم افزار: بهینه سازی خوشه ها با بهره گرفتن از الگوریتم های تکاملی برای شخصی سازی وب مارس 23rd, 2020 by tez Facebook پایان نامه ارشد نرم افزار: بهینه سازی خوشه ها با بهره گرفتن از الگوریتم های تکاملی برای شخصی سازی وب پایان نامه رشته مهندسی کامپیوتر گرایش : نرم افزار دانشگاه آزاد اسلامی واحد علوم و تحقیقات سمنان پایان نامه: مهندسی کامپیوتر گرایش: نرمافزار عنوان پایان نامه: بهینه سازی خوشه ها با بهره گرفتن از الگوریتم های تکاملی برای شخصی سازی وب استاد راهنما: دکتر محمد کریم سهرابی استاد مشاور: دکتر فرزین یغمایی فهرست مطالب:چکیده ۱فصل اول. ۲۱-۱-مقدمه. ۳۱-۲-تعریف مسئله ۴۱-۳-اهمیت و ضرورت تحقیق. ۵۱-۴-شیوه پژوهش ۸۱-۵-چارچوب پایان نامه ۸مراجع ۱۰فصل دوم: ۱۱۲-۱-مقدمه ۱۲۲-۲-مروی بر کارهای انجام شده. ۱۲مراجع. ۲۱فصل سوم: ۲۴۳-۱-مقدمه. ۲۵۳-۲-مراحل وب کاوی. ۲۶۳-۲-۱-انواع وبکاوی ۲۷۳-۳-شخصیسازی وب. ۲۸۳-۳-۱-دلایل نیاز به شخصیسازی وب. ۲۸۳-۳-۲-مراحل شخصی سازی وب ۲۹۳-۳-۲-۱-جمع آوری داده ۳۰۳-۳-۲-۲-پردازش داده. ۳۱۳-۳-۲-۳-کشف الگو ۳۱۳-۳-۲-۴-تحلیل دانش. ۳۱۳-۳-۳-تکنیک های مدلسازی کاربر در شخصیسازی وب. ۳۱۳-۳-۳-۱-تکنیک tf-idf.3-3-3-2-تکنیک متا مدل و ابزار OLAP.3-3-3-3-تکنیک براساس محتوای وب ۳۳۳-۳-۳-۴-تکنیک براساس فراهم کردن دادههای موثر (ODP)3-3-3-5-شخصیسازی وب با بهره گرفتن از روشهای ترکیبی ۳۴۳-۳-۳-۶-شخصیسازی وب براساس الگوریتم استقرایی و تکنولوژی tf-idf.3-3-3-7-شخصیسازی وب با بهره گرفتن از کندوکاو الگوی ترتیبی و درخت الگو. ۳۵۳-۴-خوشهبندی برای شخصیسازی وب. ۳۵۳-۴-۱-خوشه بندی فازی ۳۶۳-۴-۱-۱-الگوریتم پایهای خوشهبندی فازی ۳۶۳-۴-۱-۲-الگوریتم فازی کا-مینز. ۳۶۳-۴-۱-۳-خوشهبندی صفحات وب با بهره گرفتن از خوشه بندی فازی k-means3-4-2-الگوریتم ژنتیک. ۳۹۳-۴-۲-۱-بهینهسازی خوشهبندی فازی با بهره گرفتن از الگوریتم ژنتیک ۴۰۳-۴-۳-روش پیشنهادی در این تحقیق. ۴۲۳-۴-۴-شمای کلی سیستم پیشنهادی ۴۲۳-۴-۵-مثالی از سیستم پیشنهادی. ۴۳۳-۴-۶-شبه کد روش پیشنهادی ۵۰۳-۵-جمعبندی. ۵۱مراجع ۵۳فصل چهارم:. ۵۵۴-۱-مقدمه. ۵۶۴-۲-مجموعه داده ها ۵۶۴-۲-۱-دیتاست YANDEX.4-2-1-1-پیش پردازش انجام شده با مجموعه داده های خام قبل از انتشار ۵۷۴-۳-پارامترهای ارزیابی ۶۰۴-۴-آزمایشات انجام شده. ۶۱۴-۴-۱-سخت افزار مورد استفاده ۶۲۴-۴-۲-نتایج آزمایشات. ۶۲۴-۵-جمعبندی. ۶۴مراجع: ۶۵فصل پنجم:. ۶۶۵-۱-مقدمه. ۶۷۵-۲-نتایج و دستاوردهای پروژه. ۶۸۵-۳-پیشنهادات. ۶۸مراجع. ۷۰چکیده:گرانبار شدن اطلاعات یک مشکل عمده در وب کنونی به شمار میرود. برای مقابله با این مشکل، سیستمهای شخصیسازی وب ارائه شده اند که محتوا و سرویسهای یک وبسایت را با افراد براساس علایق و رفتار گردشی آنها سازگار می کنند. یک مؤلفهی اساسی در هر سیستم شخصیسازی وب، مدل کاربر آن است. هدف از شخصی سازی وب، مهیا ساختن محتوا و سرویسهای مورد نیاز کاربران به وسیله دانش به دست آمده از تعاملات قبلی کاربران در صفحات وب است. در حال حاضر، برای شخصیسازی وب چندین متد خوشهبندی در دسترس است. روشهایی که تاکنون ارائه شده اند، در مواردی دارای اشکالاتی بودند. البته تکنیکهای جدیدی در رفع این مشکلات و بهبود آنها ارائه شده است. اما در بیشتر این تکنیکها، مسائل افزونگی داده و مقیاسبندی بالا وجود دارد. با توجه به اینکه افزایش کاربران وب منجر به افزایش اندازهی خوشه میگرد، نیاز به بهینهسازی خوشهها اجتنابناپذیر خواهد بود. در تحقیق، یک متدولوژی بهینهسازی خوشه بر اساس سیستم فازی ارائه شده است. به منظور افزایش دقت نهایی خوشه بندی، برای تنظیم پارامترهای توابع عضویت از الگوریتم ژنتیک استفاده شده است. نتایج حاصل از شبیهسازی نشان میدهد که روش پیشنهادی دقت خوشه بندی صفحات وب را تا حد قابل توجهی افزایش میدهد.فصل اول: کلیات تحقیق۱-۱- مقدمهبا توسعه سیستمهای اطلاعاتی، داده به یکی از منابع پراهمیت سازمانها مبدل گشته است. بنابراین روشها و تکنیکهایی برای دستیابی کارا به داده، اشتراک داده، استخراج اطلاعات از داده و استفاده از این اطلاعات، مورد نیاز میباشد. با ایجاد و گسترش وب و افزایش چشمگیر حجم اطلاعات، نیاز به این روشها و تکنیکها بیش از پیش احساس میشود. وب، محیطی وسیع، متنوع و پویا است که کاربران متعدد اسناد خود را در آن منتشر میکنند. در حال حاضر بیش از دو بیلیون صفحه در وب موجود است و این تعداد با نرخ ۷.۳ میلیون صفحه در روز افزایش مییابد. با توجه به حجم وسیع اطلاعات در وب، مدیریت آن با ابزارهای سنتی تقریباً غیر ممکن است و ابزارها و روشهایی نو برای مدیریت آن مورد نیاز است. به طور کلی کاربران وب در استفاده از آن با مشکلات زیر روبرو هستند:۱- یافتن اطلاعات مرتبط: یافتن اطلاعات مورد نیاز در وب دشوار میباشد. روشهای سنتی بازیابی اطلاعات که برای جستجوی اطلاعات در پایگاه دادهها به کار میروند، قابل استفاده در وب نمیباشند و کاربران معمولاً از موتورهای جستجو که مهمترین و رایج ترین ابزار برای یافتن اطلاعات در وب می باشند، استفاده میکنند. این موتورها، یک پرس و جوی مبتنی بر کلمات کلیدی از کاربر دریافت کرده و در پاسخ لیستی از اسناد مرتبط با پرس و جوی وی را که بر اساس میزان ارتباط با این پرس و جو مرتب شده اند، به وی ارائه می کنند. اما موتورهای جستجو دارای دو مشکل اصلی هستند (Baeza-Yates, 2004). اولاً دقت موتورهای جستجو پایین است، چراکه این موتورها در پاسخ به یک پرس و جوی کاربر صدها یا هزاران سند را بازیابی میکنند، در حالی که بسیاری از اسناد بازیابی شده توسط آنها با نیاز اطلاعاتی کاربر مرتبط نمیباشند (Bharat, and et. al., 2001). ثانیاً میزان فراخوان این موتورها کم میباشد، به آن معنی که قادر به بازیابی کلیه اسناد مرتبط با نیاز اطلاعاتی کاربر نیستند. چرا که حجم اسناد در وب بسیار زیاد است و موتورهای جستجو قادر به نگهداری اطلاعات کلیه اسناد وب، در پایگاه دادههای خود نمیباشند (Chakrabarti, and et. al., 1999).2- ایجاد دانش جدید با بهره گرفتن از اطلاعات موجود در وب: در حال حاضر این سوال مطرح است که چگونه میتوان دادههای فراوان موجود در وب را به دانشی قابل استفاده تبدیل کرد، به طوری که یافتن اطلاعات مورد نیاز در آن به سادگی صورت بگیرد. همچنین چگونه میتوان با بهره گرفتن از دادههای وب به اطلاعات و دانشی جدید دست یافت.۳- خصوصی سازی اطلاعات: از آن جا که کاربران متفاوت هر یک درباره نوع و نحوهی بازنمایی اطلاعات سلیقه خاصی دارند، این مسئله باید توسط تأمینکنندگان اطلاعات در وب مورد توجه قرار بگیرد. برای این منظور با توجه به خواستهها و تمایلات کاربران متفاوت، نحوه ارائه اطلاعات به آنها باید سفارشی گردد.تکنیکهای وب کاوی قادر به حل این مشکلات میباشند (Chakrabarti, 2000).2-1- تعریف مسئلهوب به یک بخش تسلیم نشدنی جهان تبدیل شده است و گشت و گذار وب، یک فعالیت مهم برای مشتریانی که خرید آنلاین دارند، به شمار میآید (Varghese, 2012). همانطور که گفته شد، با توجه به حجم وسیع اطلاعات در وب، مدیریت آن با ابزارهای سنتی تقریباً غیر ممکن است و ابزارها و روشهایی نو برای مدیریت آن مورد نیاز است. یکی از این روشها وبکاوی است. به طور کلی وبکاوی را میتوان داده کاوی بر روی داده های محتوا، ساختار و کاربرد وب به حساب آورد. هدف وبکاوی کشف مدلها و الگوهای نهفته در منابع وب میباشد. هدف وب کاوی کاربرد وب به طور خاص کشف الگوهای رفتاری کاربران وب میباشد. کشف چنین الگوهایی از حجم عظیمی از داده های تولید شده توسط وب سرورها کاربردهای مهمی دارد (Anand, and Mobasher, 2005). از جملهی آنها میتوان به سیستمهایی که میزان مؤثر بودن یک سایت را در برآوردن انتظارات کاربر ارزیابی می کنند، تکنیکهایی برای متعادل کردن پویای بار و بهینهسازی وب سرورها برای دستیابی مؤثرتر کاربران و کاربردهای مربوط به ساختاردهی مجدد و تطبیق یک سایت براساس نیازهای پیش بینی شدهی کاربر اشاره کرد.کشف استخراج اطلاعات مفید از دادهی وب یا فایلهای وبلاگ، بهبود کارایی اطلاعات وب و فراهم کردن تکنولوژی برای کاربردهای وب به عنوان مثال، شخصیسازی و غیره از جمله اهداف دیگر وبکاوی میباشد. برای مدیریت تصمیم گیری، نتیجه کاوش کاربرد وب می تواند برای تبلیغات، بهبود طراحی وب، بهبود رضایت مشتری، هدایت استراتژی تصمیم آنالیز بازار و سازمان مورد استفاده قرار گیرد (Naveena Devi et al., 2012).در سال های اخیر تکنیکهای وبکاوی کاربرد وب به عنوان رویکردی دیگر که مبتنی بر کاربر است در شخصیسازی وب ارائه شده است که برخی از مشکلات مربوط به فیلترکردن جمعی را کاهش میدهد. به طور خاص وب کاوی کاربرد وب برای افزایش گسترشپذیری سیستم های شخصیسازی شدهی سنتی که برمبنای تکنیکهای فیلترکردن جمعی میباشند استفاده شده است.شخصیسازی صفحه وب شامل خوشهبندی صفحات مختلف وبی است که الگوی مشابهی دارند. شخصیسازی وب از تکنیک کاربرد وب کاوی برای سفارشی کردن صفحات وب برای یک کاربر خاص استفاده می کند. این مسئله شامل استخراج جلسات کاربر از فایلهای ورود به سیستم میشود. یک جلسه کاربر، دنبالهی صفحات وبی که توسط کاربر در یک دوره زمانی خاص مورد دسترسی قرار گرفته، میباشد.۳-۱- اهمیت و ضرورت تحقیقبا رشد ناگهانی اندازه وب و استفاده از وب گسترده جهانی، برای کاربران بسیار مشکل شد که بتوانند به طور مؤثر به اطلاعات مرتبط و مورد علاقه خود دسترسی پیدا کنند. نیاز به پیش بینی نیازهای کاربر به منظور بهبود قابلیت استفاده و حفظ کاربر سایت، آشکار است و می تواند با بهره گرفتن از شخصیسازی آدرسدهی شود. شخصیسازی وب، پردازشی از یک سایت برای بر طرف کردن نیاز یک کاربر خاص یا مجموعه ای از کاربران با بهره گرفتن از دانش به دست آمده از طریق تحلیل رفتار گشت و گذار کاربر است. هدف از سیستم شخصی سازی وب، مهیا ساختن اطلاعات و نیازهای کاربران، بدون این که صریحاً از آنها سوالی پرسیده شود.هر اقدامی که اطلاعات یا سرویسهای فراهم شده توسط یک وبسایت با نیازهای یک کاربر یا گروه خاصی از کاربران با به کارگیری دانش بدست آمده از رفتار گردشی کاربر و علایق خاص او به صورت ترکیب با محتوا و ساختار وبسایت سازگار می کند شخصیسازی وب نامیده میشود (Eirinaki, 2003).بطور کلی اهداف شخصی سازی وب عبارتند از:– شخصیسازی سرویسهای ارائه شده توسط یک وبسایت نقش مهمی در کاهش گرانبار شدن اطلاعات ایفا می کند و وبسایت را به یک محیط کاربر پسندتر برای افراد تبدیل می کند.– با فراهم کردن اطلاعات دلخواه کاربر به روش مناسب و در زمان مناسب، باعث بهبود گردش کاربر در وب سایت میشود.– در تجارت الکترونیکی مکانیزیمی برای درک بهتر نیازهای مشتری، شناسایی تمایلات آیندهی او و در نهایت افزایش پابرجایی مشتری به سرویس ارائه شده فراهم می کند.در سال های اخیر تکنیکهای وبکاوی کاربرد وب به عنوان رویکردی دیگر که مبتنی بر کاربر است در شخصیسازی وب ارائه شده است که برخی از مشکلات مربوط به فیلترکردن جمعی را کاهش می دهند. به طور خاص وب کاوی کاربرد وب برای افزایش گسترش پذیری سیستمهای شخصیسازی شدهی سنتی که برمبنای تکنیکهای فیلترکردن جمعی میباشند استفاده شده است.به طور نمونه شخصی سازی برروی پردازش شناسایی کاربر وب، جمع آوری اطلاعات از طریق اولویت یا علاقهمندی های کاربر، تمرکز دارد. به طور مختصر شخصیسازی وب می تواند برای مهیا ساختن سرویس با کیفیتتر استفاده شود و برنامه کاربردی از وب را برای کاربران در طول گشت و گذار آنها در وب مهیا سازد. این فعالیتها می تواند با مشخص کردن لینکها و لینکهای جدید مورد علاقه کاربر به صورت اتوماتیک و ایجاد صفحات ایندکس جدید، ساخته شود.رویکرد تنها مبتنی بر کاربرد در شخصیسازی وب یک عیب مهم دارد و آن این است که فرایند توصیه به کاربر تنها براساس داده های تراکنشی موجود او صورت میگیرد و از این رو اقلام یا صفحاتی که اخیراً به سایت اضافه شده اند نمیتوانند به او توصیه شوند. این مشکل عموماً مشکل قلم جدید نامیده میشود. از سوی دیگر اگرچه الگوهای کشف شدهی مربوط به کاربرد منابع وب از طریق وبکاوی کاربرد وب در کشف ارتباطات اقلام با یکدیگر یا کاربران با یکدیگر و نیز تعیین شباهت در جلسات کاربر مفیدند اما بدون استفاده از دانش عمیقتری از دامنهی وب سایت مورد نظر چنین الگوهایی درک اندکی از دلایل آن که چرا اقلام یا کاربران در گروههایی با هم قرار میگیرند در اختیار ما قرار می دهند. یک رویکرد معمول برای حل این مشکل در فیلتر کردن جمعی آن است که مشخصات محتوای صفحات را با رتبه بندیها و قضاوتهای کاربر ادغام کنیم. به طور کلی در این رویکردها کلمات کلیدی از محتوای وبسایت استخراج میشوند و برای اندیسگذاری صفحات براساس محتوا یا طبقه بندی آنها به دستههای مختلف مورد استفاده قرار میگیرند. در حوزه شخصیسازی وب این رویکرد به سیستم اجازه میدهد تا صفحات را نه تنها براساس افراد مشابه بلکه براساس شباهت محتوایی آنها به صفحاتی که کاربر اخیراً بازدید کرده است به او توصیه کند.یک ضعف عمده در بیشتر رویکردهای موجود که از محتوای وب برای بهبود مدل کاربر استفاده میکنند این است که این روشها معمولاً از بردار عبارات برای نمایش علایق کاربر استفاده می کنند و ارتباطات معنایی بین این عبارات را نادیده میگیرند. در صورتی که میتوان با بهره گرفتن از معنا این روش نمایش را بهبود داد.روشهایی که تاکنون ارائه شده اند، در مواردی دارای اشکالاتی بودند. البته تکنیکهای جدیدی در رفع این مشکلات و بهبود آنها ارائه شده است. اما در بیشتر این تکنیکها، مسائل افزونگی داده و مقیاسبندی بالا وجود دارد. الگوریتمهای خوشهبندی متعددی براساس تکنیکهای مختلف وجود دارد. بیشتر این الگوریتمها، اشکالات متعددی دارند. همانطور که اندازه خوشه در طی افزایش کاربران وب افزایش مییابد، نیاز به بهینهسازی خوشه ها اجتناب ناپذیر خواهد بود. در این پایاننامه قصد بر آنست تا یک متدولوژی بهینهسازی خوشه بر اساس سیستم فازی و الگوریتم ژنتیک ارائه شود.تعداد صفحه : ۸۲قیمت : ۱۴۷۰۰ تومان بلافاصله پس از پرداخت لینک دانلود فایل در اختیار شما قرار می گیرد و در ضمن فایل خریداری شده به ایمیل شما ارسال می شود. پشتیبانی سایت : * [email protected]