پایان نامه ارشد با موضوع انعطافپذیری، بازیابی اطلاعات، ارزیابی توان، دانشجویان

دانلود پایان نامه

خصوصیات دامنه موردبحث تولیدشوند. البته این مجموعه دادهها هرچقدر هم که دقیق تولید شدهباشند، نمیتوانند طبیعت کاربران و دادههای حقیقی را منعکس کنند. علاوهبر آن ممکن است با شرایط یک الگوریتم جور درآمده و به خوبی روی آن جواب دهند ولی برای الگوریتمهای دیگر ناجور جواب دهند و بههمین دلیل نتایج مقایسهای بدست آمده از تست الگوریتمها بر روی آنها چندان قابل اعتماد نیستند. البته استفاده از دادههای مصنوعی میتواند در موارد محدودی چون گامهای اولیه ایجاد سیستم و یا قبل از تکمیل جمعآوری دادههای حقیقی، مفید واقعشود. با توجه به موارد مطرح شده، ایجاد تکنیکهایی برای مدلسازی علایق کاربر و تولید دادههای مصنوعی بهتر، خود یک زمینه تحقیقاتی بهشمار میرود که میتواند به توسعه سیستمهای پیشنهاددهنده دقیقتر نیز منجر شود[۶۴,۶۵].
مساله بعدی انتخاب شاخصی برای ارزیابی سیستم پیشنهاددهنده است. اکثریت روشهای تجربی ارزیابی که تا به امروز ارائه شدهاند بر ارزیابی صحت۱۲۲ پیشنهاددهندهها تمرکز کردهاند. معیارهای صحت به شیوههای تجربی، میزان نزدیکی نرخهای پیشبینیشده اقلام را با نرخهای واقعی ارائهشده از سوی کاربران مشخص کنند. دو تا از معروفترین شاخصهای صحت عبارتند از دقت۱۲۳ و فراخوانی۱۲۴[۶۴].
دقت و فراخوانی، معیارهای استانداردی برای ارزیابی سیستمهای بازیابی اطلاعات هستند. معیار دقت، احتمال مرتبط بودن آیتم انتخابشده را نشان میدهد. این کار با اندازهگیری نسبت اقلام مرتبط انتخابی به کل اقلام انتخابی انجام میگیرد. در حالیکه فراخوانی، احتمال انتخاب محصول مرتبط را بیان میکند. این کار با اندازهگیری نسبت اقلام انتخابی مرتبط به کل اقلام مرتبط انجام میگیرد. این دو پارامتر غالباً در تضاد با یکدیگر هستند و افزایش یکی از آنها باعث کاهش دیگری میشود. معیار F1 ترکیبی از دو معیار بالاست و بهصورت زیر محاسبه میشود[۶۴]:
(۴-۱۳)
پوشش۱۲۵ نیز یکی از معیارهای معروف ارزیابی پیشنهاددهندهها است و بیانکننده درصدی از کل اقلام است که سیستم قادر است پیشنهاد دهد. هرچقدر این معیار بیشتر باشد، میتوان انتظار داشت که درصد بیشتری از محصولات، میتوانند پیشنهاد دادهشوند. نسبتی از اقلام مورد علاقه کاربر نسبت به کل اقلام میتوانند روشی برای محاسبه این معیار باشد[۶۴].
بدیهی است که معیارهای دیگری نیز وجود دارند که از ابعاد دیگری به ارزیابی سیستمهای پیشنهاددهنده میپردازند. تعدادی از این شاخصهای کلیدی عبارتند از: سودمندی لیست پیشنهاد که در [۶۶] استفادهشدهاست. تازگی پیشنهاد هم میتواند از دیگر معیارها باشد، همچنین رضایت کاربر، قابلیت توسعه و قابلیت پیشرفت. این سیستمها را همچنین میتوان از نظر کارایی و اندازهپذیری جهت اندازهگیری زمان پاسخ ارزیابی کرد[۶۴,۶۵].
۴-۴ بسط قابلیتهای سیستمهای پیشنهاددهنده
توسعه سیستمهای پیشنهاددهنده از ابعاد گوناگونی مورد توجه قرارگرفتهاست. شیوههای مختلف توسعه این سیستمها که در ادامه به آنها پرداختهمیشود، عبارتند از: شرکتدادن شناختی جامع از کاربران و اقلام در فرآیند پیشنهاددهی، امتیازگذاری چندمعیاری۱۲۶، ایجاد پیشنهاددهندههای غیرتداخلی۱۲۷، انعطافپذیری۱۲۸، توسعه شاخصهای ارزیابی، استفاده از اطلاعات زمینه۱۲۹ و غیره[۷].
۴-۴-۱ شرکتدادن شناختی جامع از کاربران و اقلام در فرآیند پیشنهاددهی
اغلب روشهای پیشنهاددهی مانند فیلترسازی مشارکتی، اطلاعات پروفایل کاربران و اقلام را در فرایند پیشنهاددهی دخالت نمیدهند و تنها از مجموعه امتیازات موجود برای پیشبینی سایر اطلاعات استفاده میکنند. اگرچه تحقیقاتی در رابطه با استفاده از پروفایل کاربر و محصول در بعضی متدهای پیشنهاددهی انجامشدهاست که از آن جمله میتوان به فیلترسازی دموگرافیک[۶۱] اشارهکرد، پروفایلهای مزبور بسیار ساده هستند و از تکنیکهای پیشرفته پروفایلسازی برای ایجاد آنها استفاده نشدهاست. علاوهبر ویژگیهای پروفایلهای سنتی مانند کلمات کلیدی و دموگرافیکهای کاربری ساده، از تکنیکهای پیشرفته ساخت پروفایل، که با استفاده از روشهایی چون قوانین دادهکاوی۱۳۰ [۶۷,۶۸] و دنبالهها۱۳۱ [۶۹] قادرند علایق کاربر را از طریق تراکنشها و سایر اطلاعات مرتبط با وی استنتاج و توصیف کنند، برای ساخت پروفایلهای کاملتر کاربری استفاده میشود.
۴-۴-۲ امتیازگذاری چندمعیاری
اغلب سیستمهای پیشنهاددهنده فعلی با امتیازگذاری یک معیاری سروکار دارند مثل امتیازگذاری فیلمهای دیدهشده و یا کتابهای خواندهشده. با این وجود در بعضی از کاربردهای پیشنهاددهنده، درگیر کردن امتیازت چندمعیاری ضروری بهنظر میآید. مثلاً اغلب راهنماهای رستورانها سه معیار را برای امتیازت رستورانها ارائه میدهند: کیفیت غذا، خدمات و دکور. به موضوع امتیازگذاری چندمعیاری در تحقیقات حوزه سیستمهای پیشنهاددهنده اهمیت چندانی داده نشدهاست. راهحلهای کلی برای بهینهسازی مسائل چندمعیاری شامل موارد زیر است:
– راهحلهای رسیدن به شرایط بهینه پرتو۱۳۲. پرتو می‌گوید که اگر سیاستی واجد این شرط باشد که بدون این که وضع عده‌ای را بدتر کند وضع عده‌ای دیگر را بهتر کند باید اعمال شود. این کار را تا جایی ادامه می‌دهیم که دیگر نتوان وضع عده‌ای را بدون بدتر کردن وضع عده‌ای دیگر بهبود بخشید. این جا شرایط بهینه پرتو است.
– تشکیل یک ترکیب خطی از چندین معیار موجود و درنتیجه تبدیلکردن مساله به مسالهای تکمعیاری.
– مشخصنمودن یکی از معیارها بهعنوان مهمترین آنها وبهینهسازی آن درحالی که سایر معیارها بهعنوان محدودیتهای جانبی مساله درنظر گرفتهشدهاند.
– بهینهسازی تکتک معیارها بهصورت پیدرپی و جداگانه درحالی که سایر معیارها بهعنوان محدودیتهای جانبی مساله درنظر گرفتهشدهاند.
مسائل ذکرشده هرکدام میتواند به یک مساله تحقیقاتی موردتوجه و بحثبرانگیز تبدیلشود.
۴-۴-۳ پیشنهاددهندههای غیرتداخلی
اغلب سیستمهای پیشنهاددهنده نیاز به بازخورد مستقیم کاربر دارند و بههمین جهت کاربر را درگیر عملیات پیشگویی میکنند. مثلاً قبل از اینکه سیستم بتواند مقالات یک گروه خبری را پیشنهاد دهد، نیاز دارد تا به اندازه کافی امتیازات مقالات خواندهشده از کاربر دریافت کند. بعضی از پیشنهاددهندهها سعی کردهاند تا از روشهای امتیازگذاری غیرتداخلی استفاده کنند. این روشها بهصورت غیرمستقیم امتیازات را تخمین میزنند. مثلاً از روی مقدار زمانی که یک کاربر صرف خواندن یک مقاله میکند، امتیاز کاربر به مقاله حدس زده میشود. برای آشنایی با بعضی از روشهای غیرمستقیم برای بدست آوردن بازخورد کاربر به[۷] مراجعهکنید. امتیازگذاریهای غیرتداخلی موجود چندان دقیق نیستند و نمیتوانند جایگزین کاملاً مناسبی برای روش امتیازگذاری مستقیم باشند. مساله کاهش میزان تداخل در عین حفظ سطوح دقت، جزء نیازهای مهم سیستمهای پیشنهاددهنده است که باید توسط محققان این حوزه مورد توجه قرار گیرد. یکی از راهحلهای ارائهشده بدست آوردن تعداد بهینهای از امتیازات هر کاربر جدید قبل از ورود او به سیستم است. مثلاً سیستم MovileLens.org، قبل از پیشنهاد هر فیلمی از کاربر میخواهد تا میزان از پیشتعیینشدهای فیلم را امتیازگذاری کند (مثلاً ۲۰ تا)، بنابراین در اینگونه سیستمها پیداکردن این عدد بهینه، مسالهای اساسی خواهدبود.
۴-۴-۴ انعطافپذیری
اکثر روشهای پیشنهاددهنده بهاصطلاح در سیستم سیمپیچی۱۳۳ شدهاند. به این معنی که قادرند تنها مجموعه ثابت و از پیشتعریفشدهای از پیشنهادات را به کاربر ارائهدهند و بنابراین قادر نخواهند بود نیازهای پیشنهادی کاربران را در زمان اجرا شخصیسازی کنند. در [۷۰] زبان پرسوجوی پیشنهاد۱۳۴، RQL، بهعنوان راهحل این مشکل ارائهشدهاست. RQL زبانی شبه SQL میباشد که امکان درخواست پیشنهادات منعطف از سوی کاربر را امکانپذیر میسازد. مثلاً درخواست “به کاربران نیویورکی سه تا از بهترین فیلمهایی که زمان نمایش آنها بیشتر از دو ساعت است، نمایش بده”، با استفاده از RQL در شکل ۴-۱ نمایش دادهشدهاست.
شکل ۴-۱: نمونهای از زبان RQL
علاوهبراین، اغلب پیشنهاددهندهها اقلام را بهصورت مجزا به کاربران پیشنهاد میدهند. در این سیستمها مساله تجمع۱۳۵ مورد توجه نبودهاست. با این حال در بعضی از کاربردها نیاز به انجام پیشنهادات مجتمعشده وجوددارد، مثل نیاز به پیشنهاد مارکها یا گروههایی از محصولات به گروههای خاصی از کاربران. مثلاً یک پیشنهاددهنده بستههای مسافرتی ممکن است بخواهد در خلال یک تعطیلات بهاری بستههای مسافرتی فلوریدا را (دستهبندی محصولات) به دانشجویان شمالی دوره لیسانس (بخش کاربری) پیشنهاد دهد. در چنین مواردی بهجای تخمین امتیازات یک کاربر به محصولات مجزا، باید امتیازات دستههای کاربری به گروههای محصولات تخمین زدهشود. سیستمهای مبتنی بر OLAP بهشکل ذاتی از سلسلهمراتب و تجمع پشتیبانی میکنند. استفاده از روشهای مبتنی بر OLAP در سیستمهای پیشنهاددهنده در تحقیقاتی چون [۷۰] و [۱۰] ارائهشدهاست. با این وجود هنوز به تحقیقات زیادی نیاز است تا از مزایای روشهای OLAP بهدرستی در پیشنهاددهندهها استفاده شوند.
۴-۴-۵ توسعه شاخصهای ارزیابی
استفاده از شاخصهای ارزیابی مناسب برای اندازهگیری کارایی پیشنهادات جزء حوزههای تحقیقاتی سیستمهای پیشنهاددهنده است. از جمله این تحقیقات میتوان به [۶۴]، [۶۵]و[۶۶] اشارهکرد. اگرچه معیارهای تجربی ارزیابی مشهور مانند دقت و پوشش، ضروری و پراستفادهاند، اما دارای محدودیتهای خاص خود نیز هستند. یکی از محدودیتها این است که معیارهای مذکور بر روی دادههای آزمایشیای که کاربر امتیازگذاری کردهاست، آزمایش میشوند. چنین مجموعهای میتواند یک نمونه نامتوازن محسوب شود، زیرا کاربران احتمالاً اقلامی را امتیازگذاری میکنند که بیشتر به آنها علاقه دارند. بنابراین، نتایج ارزیابیهای تجربی معمولاً مشخص میکنند که سیستم تا چه حد در رابطه با اقلامی که کاربر تصمیم دارد امتیازگذاریشان کند، دقیق است اما امکان ارزیابی توانایی سیستم در رابطه با اقلام تصادفی وجودندارد. پس انجام آزمایشاتی برای ارزیابی صحیح و شناخت مزایا و محدودیتهای تکنیکهای ارائهشده پیشنهاددهی ضروری است، هرچند این آزمایشات زمانبر و پرهزینه هستند و بههمین دلیل به ندرت انجام میشوند. نمونهای از چنین ارزیابیهایی در [۷۱] آمدهاست.
علاوهبرآن، اگرچه اندازهگیری دقت و پوشش پیشنهادات ضروری است اما معیارهای ذکرشده بهطرز مناسبی کیفیت و کارامدی سیستمهای پیشنهاددهنده را ارزیابی نمیکنند. مثلاً شاخصهای اقتصادگرا که ارزش کسبوکار را مشخص میکنند در سیستمهای پیشنهاددهنده مورد توجه نبودهاند. ارزیابی سیستمهای پیشنهاددهنده از نظر معیارهایی چون چرخه حیات مشتری۱۳۶ و بازگشت سرمایه۱۳۷ موضوعات تحقیقاتی مورد

مطلب مرتبط :   دانلود مقاله با موضوعفیزیولوژی، فشار بخار آب، استان خوزستان، تولیدات کشاورزی

پاسخی بگذارید