پایان نامه ارشد با موضوع یادگیری ماشین، ارزیابی عملکرد، روشهای ارزیابی، مزایا و معایب

دانلود پایان نامه

مبتنیبرکسینوس، با تغییراتی چون رایگیری پیشفرض۱۰۷، معکوس فراوانی کاربر۱۰۸، تقویت وضعیت۱۰۹ و پیشگویی وزن اکثریت۱۱۰، توسعه دادهشدهاند[۷]. در روش دیگری که برای بهبود کیفیت سیستمهای پیشنهاددهنده فیلترسازی مشارکتی بهکار رفتهاست، به جای محاسبه میزان شباهت کاربران، از دو روش مبتنی بر همبستگی و مبتنی بر کسینوس برای محاسبه میزان شباهت میان اقلام استفادهشدهاست. از این نقطهنظر میتوان الگوریتمهای فیلترسازی مشارکتی را به دو دسته مبتنیبرکاربر۱۱۱ و مبتنیبرآیتم۱۱۲ تقسیم نمود. در دسته اول، سیسستم کاربران مشابه با کاربر هدف را پیدا میکند و کالاهایی که مورد علاقه آن کاربران است را به کاربر هدف پیشنهاد میدهد. در دسته دوم، سیستم بهجای آنکه کاربران همسایه کاربر هدف را پیدا کند، آیتمهای مشابه با آیتمهایی را که کاربر قبلاً به آنها امتیاز بالایی دادهاست، پیدا میکند و به کاربر پیشنهاد میدهد و تشابه بین آیتمها را بر اساس امتیازگذاریهای دیگر کاربران تشخیص میدهد. بنابراین امتیاز کاربر به یک محصول هدف، با توجه به میانگین اوزان امتیازات کاربر هدف به اقلام مشابه محصول موردنظر محاسبه میشود. مثلاً در محاسبه تشابه مبتنیبرکسینوس، دو محصول i و j بهصورت دو بردار در فضای m کاربر که این دو محصول را امتیازدهی کردهاند، درنظر گرفتهمیشوند، سپس شباهت میان آنها از طریق محاسبه کسینوس زاویه بین این دو بردار محاسبه میشود. مقایسات تجربی ثابت کردهاند که الگوریتمهای مبتنیبرآیتم علاوهبر اینکه از کارایی محاسباتی بهتری در مقایسه با روشهای سنتی فیلترسازی مشارکتی برخوردارند، کیفیت پیشنهاددهی بهتر و یا حداقل معادل با الگوریتمهای مبتنیبرکاربر نیز دارند[۵۶,۵۸].
همانطور که گفتهشد، علاوهبر این روشها که جزء روشهای مبتنیبرحافظه هستند، الگوریتمهای دیگری نیز در گروه فیلترسازی مشارکتی قرار میگیرند که بهعنوان روشهای مبتنیبرمدل شناخته میشوند. الگوریتمهای بر اساس مدل، با استفاده از مجموعه امتیازات موجود، مدلی را ایجاد کرده و از آن بهمنظور پیشگویی امتیازات استفاده میکنند. مدل موردنظر توسط تکنیکهای آماری ویادگیری ماشین ایجاد میشود. در تحقیقاتی چون [۵۷] و [۵۹] ، شیوههای مبتنیبرمدل ارائهشده با شیوههای استاندارد مبتنیبرحافظه مقایسه شدهاند و نتایج نشان میدهند که در بعضی از کاربردها، روشهای مبتنیبرمدل از لحاظ دقت پیشنهاددهی بهتر از دسته دیگر روشها عمل میکنند. البته مقایسات انجامشده و نتایج بدست آمده در این تحقیقات، کاملاً جنبه آزمایشی و تجربی داشته و از هیچ تئوری نظری خاصی پیروی نمیکنند. در [۶۰] ترکیبی از روشهای مبتنیبرمدل و مبتنیبرحافظه ارائهشدهاست. نتایج تجربی ارزیابی روش نشان میدهند که یک روش ترکیبی در مقایسه با روشهای خالص پیشنهادهای بهتری ارائه میکند.
۴-۲-۲-۱ مشکلات و محدودیتهای روشهای فیلترسازی مشارکتی
بعضی از محدودیتها و ضعفهای سیستمهای مبتنی بر محتوا در سیستمهای پیشنهاددهنده فیلترسازی مشارکتی وجود ندارد. در واقع، به این دلیل که پیشنهاددهندههای فیلترسازی مشارکتی از امتیازات سایر کاربران برای تخمین امتیازات استفاده میکنند، میتوانند هر نوع محتوا و هر قلم کالایی را که حتی ممکن است با کالاهای مشاهدهشده قبلی متفاوت باشند، پیشنهاد دهند. با این وجود، این روشها نیز محدودیتها و مشکلات خود را دارند که در ادامه به آنها پرداخته میشود.
* مشکل کاربر جدید۱۱۳
این مشکل در این نوع سیستمها، همانند سیستمهای مبتنی بر محتوا به چشم میخورد. برای انجام پیشبینیهای دقیق، سلایق کاربر را باید از امتیازاتی که او به اقلام مختلف دادهاست، بدست آورد. به همین دلیل برای یک کاربر جدید، به دلیل وجود نداشتن امتیازات کافی، نمیتوان عملیات پیشبینی و ارائه پیشنهاد را انجام داد. یکی از راه حلهای این مشکل، استفاده از ترکیب یک روش مبتنی بر محتوا در سیستم پیشنهاددهنده فیلترسازی مشارکتی است. در بخشهای بعدی با اینگونه روشها که با نام روشهای ترکیبی شناخته میشوند، آشنا میشویم.
* مشکل محصول جدید۱۱۴
در هر سیستم پیشنهاددهندهای اقلام جدید بهطور متناوب اضافه میشوند. تا زمانی که امتیازات به حد کافی از طرف کاربران مختلف به یک محصول جدید داده نشود، سیستم پیشنهاددهنده بر مبنای فیلترسازی مشارکتی، آن محصول را به هیج کاربری پیشنهاد نمیدهد. این مشکل را نیز با کمک روشهای ترکیبی میتوان حلکرد.
* خلوت بودن۱۱۵ ماتریس کاربر – اقلام
همانگونه که اشاره شد، این ماتریس، ماتریسی است با ابعاد n×m که n تعداد کاربران و m تعداد اقلام میباشد و هر سلول (i , j) این ماتریس، امتیازی است که توسط کاربر i به محصول j دادهشدهاست. در همه سیستمهای پیشنهاددهنده، تعداد امتیازات دادهشده از تعداد امتیازاتی که باید توسط سیستم تخمین زده شوند، کمتر هستند. در صورتی که تعداد امتیازات موجود آنقدر کم باشد که سیستم نتواند پیشبینیهای مناسب و موثر انجام دهد، عملکرد سیستم با شکست روبرو خواهدشد و میزان درستی و صحت امتیازات پیشنهادی پایین خواهد آمد. از آنجایی که تعداد محصولات در سیستمهای پیشنهاددهنده اغلب زیاد است، در صورتی که امتیازات کاربران به آنها بسیار کم باشد، مجموعه محصولاتی که کاربران مختلف به آنها امتیاز دادهاند همپوشانی کمی خواهند داشت و بهخصوص زمانی که تعداد کاربران سیستم کم باشند، این مشکل حادتر خواهدبود. دستهبندی محصولات و کاربران میتواند تاحدی این معضل را بهبود بخشد. این دستهبندی با استفاده از اطلاعات پروفایل کاربران و اقلام صورت میگیرد. بهعنوان مثال در یک سیستم پیشنهاددهنده فیلم، فیلمها بر اساس ژانر، کارگردان، بازیگران اصلی و سایر ویژگیها دستهبندی میشوند. استفاده از پروفایل کاربران برای تقسیمبندی آنها در سیستمهای پیشنهاددهنده، یک تکنیک فیلترسازی است که با عنوان فیلترسازی دموگرافیک۱۱۶ شناخته میشود. به عنوان مثال، در [۶۱] از اطلاعاتی چون جنسیت، سن، محل سکونت، میزان تحصیلات و اطلاعات کاری کاربران که در پروفایل آنها وجوددارد و با نام اطلاعات دموگرافیک نامیده میشود، در یک سیستم پیشنهاددهنده رستوران، برای تقسیمبندی کاربران و شناسایی کاربران مشابه استفادهشدهاست. استفاده از این تکنیک در کنار تکنیک فیلترسازی مشارکتی، مشکل خلوتی ماتریس امتیازات را تاحدی حل میکند.
۴-۲-۳ روشهای ترکیبی
روشهایی که تاکنون بررسی شدهاند، تنها از یک تکنیک برای پیشنهاددهی استفاده میکنند. اما روشهای ترکیبی تلفیقی از روشهای قبلی را استفاده میکنند. همانطور که توضیح دادهشد، هر دو دسته روشهای مبتنی بر محتوا و فیلترسازی مشارکتی دارای مشکلات و محدودیتهایی هستند. سیستمهای پیشنهاددهندهای که از روشهای ترکیبی استفاده کردهاند، سعی نمودهاند تا با ترکیب دو روش مبتنی بر محتوا و فیلترسازی مشارکتی، از مزایای یکی در جهت غلبه بر محدودیتهای دیگری استفاده کنند. یک دستهبندی از شیوههای مختلف ترکیب روشهای فیلترسازی مشارکتی و مبتنی بر محتوا که در[۷] ارائهشدهاست، به شکل زیر میباشد:
* پیادهسازی روشهای مبتنی بر محتوا و فیلترسازی مشارکتی بهصورت جداگانه و بعد از آن ترکیب نتایج آنها که در مرحله پیشبینی بدست آمده اند. ترکیب نتایج میتواند بهصورت ترکیب وزندار نتایج و یا انتخاب یکی از نتایج که بر اساس یک معیار کیفی از دیگری بهتر است، صورتگیرد.
* سیستم پیشنهاددهنده بر اساس یک روش فیلترسازی مشارکتی طراحی شود و بعضی از ویژگیهای تکنیک مبتنی بر محتوا در آن وارد شود.
* سیستم پیشنهاددهنده بر اساس یک روش مبتنی بر محتوا طراحی شود و بعضی از ویژگیهای تکنیک فیلترسازی مشارکتی در آن وارد شود.
* ایجاد یک مدل عمومی و یکنواخت که ویژگیهای هر دو تکنیک فیلترسازی مشارکتی و مبتنی بر محتوا را ترکیب میکند.
در تحقیقات زیادی، کارایی روشهای ترکیبی با روشهای خالص مبتنی بر محتوا و فیلترسازی مشارکتی به شکل تجربی مقایسه شدهاند و نتایج بدست آمده به وضوح ثابت کردهاند که روشهای ترکیبی، پیشنهادهای دقیقتری در مقایسه با روشهای غیرترکیبی ارائه میکنند[۶۱,۶۲,۶۳].
۴-۳ ارزیابی۱۱۷ سیستمهای پیشنهاددهنده
برای ارزیابی موفق الگوریتمهای پیشنهاددهنده باید در رابطه با روش ارزیابی، مجموعه داده مورد ارزیابی، و انتخاب شاخص یا شاخصهایی برای ارزیابی، تصمیمگیریکرد. تا به امروز، روشهای زیادی بهمنظور ارزیابی عملکرد سیستمهای پیشنهاددهنده بهوجود آمدهاند. این روشها به دو گروه برونخطی۱۱۸ و برخط۱۱۹ تقسیم میشوند[۶۴,۶۵].
* ارزیابی برونخطی
اغلب روشهای ارزیابی الگوریتمهای پیشنهاددهنده بر تحلیل برونخط تمرکز کردهاند. در چنین نحوه ارزیابیای، الگوریتم موردنظر بر روی یک مجموعه از قبل موجود از دادهها تست شده و نتایج آن بر اساس شاخصهایی که در بخشهای پیش رو به آنها پرداخته میشود، با نتایج یک الگوریتم شناختهشده پیشنهاددهی دیگر که بر روی همین مجموعه داده اجرا میشود، مقایسه میگردد. این شیوه ارزیابی دارای مزایا و معایب مربوط به خود میباشد. برای ارزیابیهای بزرگ و زمانبر بر روی چندین مجموعه داده و یا تست همزمان چندین الگوریتم در آن واحد، این روشها سریع و اقتصادی هستند. به تنها چیزی که نیاز است، انتخاب زیرمجموعه مناسبی از این مجموعه داده است.
ارزیابی برونخطی دارای دو نقطه ضعف مهم میباشد. اول اینکه خلوتی ذاتی دادههای نرخگذاریشده باعث میشود که مجموعه اقلامی که میشود ارزیابیشان کرد، محدود باشند زیرا اگر کاربری، محصولی را امتیازدهی نکردهباشد، نمیتوان مقبولیت محصول مزبور را پس از پیشنهاد آن توسط سیستم به کاربر، ارزیابیکرد. دوم اینکه ارزیابیها محدود به نتایج پیشنهادی هستند و هیچ تحلیل برونخطیای نمیتواند مثلاً شاخصهای مرتبط با کاربر را اندازه بگیرد. شاخصهایی چون میزان رضایت کاربر از یک استراتژی پیشنهاددهی تنها در یک زمینه برخط قابل ارزیابی است.
* ارزیابی بر خط
کارایی مکانیزم بر روی یک سیستم پیشنهاددهنده در حال اجرا با کاربران روی خط، ارزیابی میشود. در ارزیابی برخط باید جامعهای از کاربران را ایجادکرد. بهدلیل مشکلات ایجاد یک سیستم زنده، ارزیابی برونخط بیشتر مورد علاقه محققان بودهاست، نه از آن جهت که بهتر است بلکه از آن جهت که انجام آن سادهتر است. آزمایشات برخط میتواند شاخصهایی چون میزان رضایت کاربر، میزان مشارکت وی و سایر پارامترهای کاربری را اندازهگیری کند.
تصمیمگیری دیگری که محققان با آن روبرو هستند، در مورد مجموعه داده انتخابی است، اینکه از مجموعه داده طبیعی۱۲۰ و از قبل موجود استفاده شود و یا از مجموعه داده مصنوعی۱۲۱ و شبیهسازی شده. اگر یک مجموعه داده از قبل ایجاد شده وجود نداشتهباشد، در شرایطی میتوان از دادههای شبیهسازیشده استفادهکرد. این مجموعهدادهها باید در هماهنگی با

مطلب مرتبط :   دانلود پایان نامه ارشد با موضوعصلاحیت جهانی، قوانین داخلی، قوانین و مقررات، تعیین مجازات

پاسخی بگذارید