م میتوانند فیلم، موزیک، صفحه وب و… باشند (جدول شماره ۱). همچنین کاربر پیشنهاداتی را از طریق یک جستجوی هوشمندانه دریافت خواهد کرد. بنابراین تاثیر به سزایی در صرفه جویی زمان و دست یابی به هدف مورد نظر کاربر دارد. زیرا از این طریق میتواند از میان این حجم بالا آن قسمت که مورد نیازش است را در اختیار داشته باشد. بدین ترتیب از سردرگم شدن کاربر هنگام تصمیمگیری جلوگیری به عمل میآید.

جدول شماره ۱ : نمونههایی از سیستمهای پیشنهادگر و اقلام پیشنهادی آنها
SYSTEM
Content
Amazon
Books, CDS, Others
Epinions
Books, CDS, Others
MovieLens
Movie
Netflix
DVD
Yahoo! Music
Music
Grundy
Books
Video Recommender
Video
Ringo
Music
PHOAKS
Textual Information
Jester
Jokes
Fab System
Web page

با افزایش روز افزون اطلاعات، نیاز به وجود این سیستمها بیشتر احساس شده است. این سیستمها پیشنهادات را با استفاده از انواع مختلف دانش و داده جمع آوری شده در مورد کاربران و اقلام و همچنین بررسی تراکنشهایی مانند بازخوردی۱۵ که کاربران در گذشته ایجاد کردهاند تولید میکنند. در سادهترین فرم، این پیشنهادات به صورت یک لیستی که بر اساس علائق و نیازهای کاربر مرتب شده به او عرضه خواهد شد.
در [۳] سیستمهای پیشنهادگر براساس فیلترینگ اشتراکی۱۶، محتوا۱۷، آمارگیری۱۸، سود۱۹، دانش۲۰،و ترکیبی۲۱ کلاسبندی شدهاند.

۱-۳-۱- سیستم پیشنهادگر بر اساس فیلترینگ اشتراکی
فیلترینگ اشتراکی یکی از رایجترین راهکارها در سیستمهای پیشنهادگر است .[۴] این راهکار اقلامی که کاربران مشابه با کاربر فعال در گذشته به آنها علاقه داشتهاند را به او پیشنهاد میکند. شباهت بین کاربران بر اساس نحوه امتیازدهیشان در گذشته محاسبه میشود.
این پایان نامه بر اساس این نوع از سیستمهای پیشنهادگر میباشد که در فصل دوم به تفصیل توضیح داده خواهد شد.

۱-۳-۲- سیستم پیشنهادگر محتوا محور

یکی از پر کاربردترین راهکارها در سیستمهای پیشنهادگر روش محتوا محور میباشد. سیستمهای محتوا محور بر اساس ویژگیهای اقلام تعریف میشوند. آنها بررسی میکنند که کاربر در گذشته چه اقلامی مورد علاقهاش بوده، سپس اقلام مشابه را به او پیشنهاد میدهند. مثلا اگر کسی در گذشته به فیلمی از نوع کمدی امتیار مثبت داده است این سیستم در آینده فیلمهایی از این نوع را به او پیشنهاد میکند. از آنجا که روش پیشنهادی در این پایان نامه از روش محتوا محور استفاده می کند، در فصل پنجم به طور مفصل در مورد سیستم پیشنهادگر محتوا محور بحث خواهد شد.

۱-۳-۳- سیستم پیشنهادگر بر اساس آمارگیری

تکنیک پیشنهاد براساس آمارگیری مبتنی بر اطلاعات آماری کاربران میباشد. دادههایی که در نمایه۲۲ کاربر وجود دارد مانند جنسیت، سن، وضعیت خانوادگی و … نمونههایی از اطلاعات آماری کاربر میباشد. کاربران بر اساس خصوصیاتشان کلاس بندی میشوند و پیشنهادات بر اساس این کلاسها صورت میپذیرد.

۱-۳-۴- سیستم پیشنهادگر بر اساس سود

سیستمهای بر اساس سود، تابع سود۲۳ که توسط کاربر تولید میشود را به کار میبرند. به عنوان مثال درقالب پرسشنامه این کار صورت میپذیرد. سپس بر اساس اینکه هر قلم۲۴ چه مقدار سود برای کاربر دارد پیشنهادات صورت میگیرد. این نوع از سیستمها تکنیکهای ارضای محدودیت۲۵ را به کار میبرند تا بهترین قلم را پیشنهاد کنند.

۱-۳-۵- سیستم پیشنهادگر بر اساس دانش

سیستمهای پیشنهادگر بر اساس دانش، از دانشی که از خصوصیات اقلام و کاربران استخراج میگردد بهره برداری میکنند. آنها بررسی میکنند که چطور یک قلم بهخصوص میتواند نیازهای کاربر را بر آورده سازد. در سادهترین فرم، دانش مذکور میتواند در فرم درخواست توسط کاربر تولید شود.

۱-۳-۶- سیستم پیشنهادگر ترکیبی

سیستمهای پیشنهادگر ترکیبی دو یا چند تکنیک را ترکیب میکنند تا کارایی سیستم پیشنهادگر را افزایش دهند. مثلا دو تکنیک A وB را ترکیب میکنند که از مزایای تکنیک اول برای بر طرف سازی معایب تکنیک دوم استفاده کنند. مثلا متد فیلترینگ اشتراکی با مشکل قلم جدید و کاربر جدید مواجه میباشد. یعنی قلمی که تا کنون هیچ کس به آن امتیازی نداده است را نمیتواند پیشنهاد کند. در عین حال متد بر اساس محتوا به دلیل اینکه پیشنهادات بر اساس محتوا و ویژگیهای اقلام میباشد نه امتیازات داده شده به آنها، چنین مشکلی را ندارد. پس میتوان از ترکیب این دو متد در برطرف کردن نواقص یکدیگر استفاده نمود.

۱-۴- بررسی سایت Movielens

MovieLens یک سیستم پیشنهادگر فیلم است (شکل شماره ۲). راهکار این سیستم به این صورت است که از کاربر میخواهد به فیلم هایی که تا کنون دیده است در بازه ۱ تا ۵ امتیازدهی کند (شکل شماره ۳). پس از آن امتیازات داده شده از سوی کاربر را ذخیره کرده و از کاربر یک مدل میسازد. زمانی که کاربر درخواست میکند که سیستم فیلمهایی را به او پیشنهاد کند، سیستم مدل کاربر فعال۲۶ و همچنن مدل کاربرانی که شبیه به او میباشند را استخراج کرده و امتیاز فیلمهایی که کاربر فعال تا کنون ندیده است را از روی مدل کاربران شبیه به او پیشبینی میکند. سپسفیلمهایی که برای آنها امتیاز بالایی پیشبینی شده است را به کاربر فعال پیشنهاد میکند. کاربر لیست پیشنهاد شده از سوی سیستم را مشاهده کرده و فیلمهای مورد علاقهاش را انتخاب میکند (شکل شماره ۴).

شکل شماره ۲ : نمونه صفحهای از سایت Movielens [5]

شکل شماره ۳: نمونه صفحه درخواست امتیازدهی Movielens از کاربر [۵]

شکل شماره ۴ : نمونه صفحه فیلمهای پیشنهادی از سوی Movielens به کاربر [۵]

۱-۵- اهداف پایان نامه

روشهای محتوا محور و فیلترینگ اشتراکی از راهکارهای موفق در سیستمهای پیشنهادگر میباشند. روش محتوا محور بر اساس ویژگیهای اقلام تعریف میشود. این روش بررسی میکند که اقلام مورد علاقه کاربر دارای چه ویژگیهایی بودهاند، سپس اقلام دارای ویژگیهای مشابه را به او پیشنهاد میکند. روش فیلترینگ اشتراکی بر اساس تعیین اقلام مشابه یا کاربران مشابه کار میکند که به ترتیب فیلترینگ اشتراکی مبتنی بر اقلام و مبتنی بر کاربران نامیده میشود.
روش پایه فیلترینگ اشتراکی مبتنی بر کاربر، به منظور پیشبینی امتیاز قلم هدف، هیچ تمایزی بین اقلام قائل نمیشود. به عبارت دیگر امتیازهای تمامی اقلام به طور یکسان در انتخاب همسایگی (کاربران مشابه) و پیشبینی تاثیر میگذارند. در این پایان نامه یک سیستم پیشنهادگر فیلترینگ اشتراکی مبتنی بر کاربر، مجهز به مکانیزم تخصیص پویای وزن به اقلام، ارائه شده است. مبنای این مکانیزم، تخصیص وزن به اقلام بر اساس میزان شباهت آنها با قلم هدف میباشد. میزان شباهت اقلام توسط یک روش محتوا محور سنجیده میشود. از آنجا که پایگاه داده مورد استفاده در این پایان نامه مربوط به فیلم است، برای بالا بردن کارایی این روش علاوه بر استفاده از ویژگی ژانرها، از ویژگیهای دیگری از جمله کارگردانان و بازیگران به عنوان دادههای مکمل استفاده شده است.

۱-۶- ساختار پایان نامه

از آنجا که اساس روش پیشنهادی در این پایان نامه فیلترینگ اشتراکی میباشد در فصل دوم به تفصیل به شرح این روش و تاریخچهای از کارهای انجام شده در این زمینه پرداخته میشود.
پس از آن به دلیل استفاده از روش محتوا محور به جهت ارتقا روش فیلترینگ اشتراکی، مبانی این روش در فصل سوم توضیح داده میشود.
در فصل چهارم روش پیشنهادی که تلفیقی از روشهای فیلترینگ اشتراکی و محتوا محور میباشد و کارهای انجام شده در این زمینه ارائه میشود.
در فصل پنجم آزمایشهای انجام شده بر روش پیشنهادی و نتایج حاصل از این آزمایشها ارائه میگردد.
در فصل ششم به جمعبندی مطالب، نتیجهگیری و ارائه پیشنهادهایی برای آینده پرداخته میشود.

فصل دوم
روش فیلترینگ اشتراکی

۲- روش فیلترینگ اشتراکی

۲-۱- پیشگفتار

این پایان نامه بر فیلترینگ اشتراکی که نوعی از سیستمهای پیشنهادگر میباشد متمرکز شده است. این نوع از سیستم های پیشنهادگر نقش قابل توجهی را در پیدا کردن سلیقه و علائق کاربر ایفا میکند. انگیزه پیدایش فیلترینگ اشتراکی از اینجا به وجود آمد که مردم معمولا بهترین پیشنهادات را از کسانی میگیرند که سلیقهشان مشابه با خودشان است. این متد، کاربران با سلیقه شبیه به هم را پیدا میکند و بر این اساس پیشنهادات را ارائه میدهد.

۲-۲- مروری بر کارهای انجام شده در این راستا

در [۶] اولین سیستم پیشنهادگر رسمی که tapestry نامیده میشود ارائه شد. این یک سیستم برای مدیریت ایمیل بود و تصدیق کرد که یک لیست ایمیل ساده نمیتواند به تمام کاربرانی که علاقهمند به محتوای یک ایمیل هستند اطمینان دریافت آن را بدهد. بنابراین به کاربران اجازه شرح پیام ایمیلها را داد تا دیگران با ساختن پرسش بتوانند آنها را فیلتر کنند. اندکی بعد محققان دریافتند که این لیست ایمیل و فیلترینگ بر اساس محتوا در رابطه با نیازهای اطلاعاتی پیچیده کاربر کافی نیست. بنابراین، این عقیده مطرح شدکه سیستم با به کاربردن عامل انسان ارتقاء خواهد یافت. عبارت فیلترینگ اشتراکی به منظور توصیف اینکه چطور کاربران میتوانند با تولید کردن بازخورد به فیلترینگ پیام ها کمک کنند به کار برده شد. این بازخورد شامل ارسال، دریافت پیام و … میباشد.
در [۷]تحقیق در مورد فیلترینگ اشتراکی با استفاده از الگوریتم مبتنی بر همسایگی برای اخبارUsenet انجام شده است. قابل ذکر است که Usenet نوعی شبکه اینترنتی میباشد. این کار توسط سیستمی که GroupLensنامیده میشود انجام پذیرفت[۸] . GroupLens که سیستمی پیشنهادگر بر اساس کاربر است به منظور ارزیابی و پیشنهاد دادن اقلام به کاربر از امتیازهای ۱ تا ۵ که دیگر کاربران به این اقلام نسبت دادهاند استفاده میکند. اکنون MovieLens که یک سیستم پیشنهادگر فیلم است راهاندازی شده است. سیستم Grouplens از معیار همبستگی پیرسون۲۷ برای نشان دادن میزان شباهت کاربران به یکدیگر استفاده میکند (فرمول شماره ۱).

p_(a,i)=¯r_a+□((∑_(u=1)^n▒〖[〖(r〗_(u,i) 〖-r ̅〗_u)*w_(a,u)]〗)/(∑_(u=1)^n▒w_(a,u) )) (1)
〖 p〗_(a,i) نشانگر امتیاز پیشبینی شده برای قلم i ام میباشد. n تعداد همسایهها را نشان میدهد، 〖 r〗_(u,i)امتیاز کاربر uبه قلم iام و r ̅_aمیانگین امتیازهای کاربر فعال میباشد. w_(a,u) میزان شباهت بین کاربر فعال و همسایه u را نشان میدهد که به صورت همبستگی پیرسون در فرمول شماره ۲ تعریف شده

دسته بندی : No category

دیدگاهتان را بنویسید