بررسی دو مورد از آنها میپردازیم.

۲-۹-۱- استفاده از امتیازهای خام

r ̅_(a,t)=□((∑_(v∈N_(t(a)))▒〖sim(A , V)r_(v,t) 〗)/(∑_(v∈N_(t(a)))▒〖sim(A , V)〗))(۷)
با استفاده از فرمول بالا میانگین وزن دارk تا از نزدیکترین همسایهها به کاربر فعال را به دست میآید. وزن هر همسایه معادل با میزان شباهت به دست آمده با استفاده از معیار همبستگی پیرسون میباشد. در نهایت نتیجه به دست آمده امتیاز پیشبینی شده میباشد.

۲-۹-۲- استفاده از امتیازهای نرمال شده

r ̅_(a,t)=r ̅_a+(∑_(v∈N_(t(a)))▒〖(r_(v,t)-r ̅_v ).sim(A , V)〗)/(∑_(v∈N_(t(a)))▒〖sim(A , V)〗) (۸)

توسط فرمول بالا این مسئله در نظر گرفته میشود که کاربران مختلف ممکن است بازههای امتیازدهی متفاوتی برای نشان دادن یک درجه اهمیت داشته باشند. در فیلترینگ اشتراکی مبتنی بر کاربر به طور استاندارد از این فرمول برای پیشبینی استفاده میشود .[۷]

۲-۱۰- مشکلات فیلترینگ اشتراکی

فیلترینگ اشتراکی علاوه بر کاربرد وسیع آن و مزایایی که از آن برخوردار است شامل معایبی نیز میباشد که در ادامه به توضیح تعدادی از آنها میپردازیم.

۲-۱۰-۱- پراکنده بودن داده۵۰

وقتی ماتریس کاربران – اقلام پراکنده و سایز آن بزرگ باشد این مشکل به وجود میآید. کاربرانی هستند که به همه اقلام امتیاز ندادهاند و تنها به تعداد کمی از آنها امتیاز دادهاند. بنابراین اقلامی وجود دارند که به اندازه کافی امتیازدهی نشدهاند. در این حالت اندازهگیری شباهت روی تعداد امتیازهای ابراز شده اندکی صورت میپذیرد که قابل اعتماد نمیباشد. یکی از مشکلاتی که به دلیل پراکنده بودن داده به وجود میآید شروع سرد است. یعنی برای کاربری که به تازگی وارد سیستم شده و به اندازه کافی امتیازی به اقلام نداده است نمیتوان پیشنهاد قابل اعتمادی ارائه کرد. همچنین قلم جدیدی که وارد سیستم میشود نیز همین مشکل را دارد. اقلامی که به اندازه کافی امتیاز دریافت نکردهاند برای پیشنهاد قابل اعتماد نمیباشند. به عنوان مثال Movielens برای اجتناب از بروز چنین مشکلی برای کاربران جدید شرط امتیاز دهی به حداقل ۱۵ قلم را در نظر گرفته است.
پژوهشهای زیادی برای رفع این مشکل انجام شده است. که بسیاری از آنها از روشهای موجود در مدل محتوا محور برای پر کردن خانههای بدون رتبه ماتریس امتیازدهی استفاده میکنند .[۳۹,۴۰,۴۱,۴۲,۴۳]

۲-۱۰-۲- مقیاس پذیری۵۱
با زیاد شدن تعداد کاربران و اقلام منابع محاسباتی برای برطرف کردن درخواستهای جدید با کمبود مواجه میشود.

۲-۱۰-۳- اقلام مشابه۵۲

بعضی اقلام شبیه به هم هستند ولی به دلیل تفاوت در نامشان سیستم پیشنهادگر یکسان بودن آنها را نمیتواند تشخیص دهد. بنابراین با آنها به طور متفاوت برخورد میکند.

۲-۱۰-۴- گری شیپ۵۳

کاربرانی هستند که سلیقهشان موافق یا مخالف با هیچ گروه از کاربران نمیباشد. بنابراین سیستم پیشنهادگر فیلترینگ اشتراکی نمیتواند هیچ منفعتی به آنها برساند.

۲-۱۱- بررسی چگونگی کارکرد و تولید پیشنهاد سایت آمازون

سایت آمازون یکی از معروفترین سایتهای تجارت الکتونیک میباشد که در سال ۱۹۹۵ فعالیت خود را با فروش بر خط کتاب شروع کرد و اکنون در آن محصولاتی مانند ساعت، کتاب، سی دی، تلویزیون و… به فروش میرسد.
آمازون از متد فیلترینگ اشتراکی استفاده میکند و پیشنهادات را بر اساس اقلام تولید میکند. زیرا تعداد اقلام از تعداد کاربران به نسبت کمتر است. روند کار آمازون به این صورت است که لیست اقلام دیده شده توسط هر کاربر در یک ماتریس ذخیره میشود. سپس با استفاده از معیار شباهت کسینوس میزان شبیه بودن بردارهای اقلام در این ماتریس محاسبه میگردد. بعد از آن شبیهترین اقلام به اقلامی که کاربر تا کنون دیده است به او پیشنهاد میشود. نسخه سادهای از چگونگی تولید پیشنهاد در (شکل شماره ۸) قابل مشاهده میباشد.

شکل شماره ۸: روند تولید پیشنهاد در آمازون [۴۴]

همانطور که مشاهده میکنید کاربر ۳ اخیرا به سیستم وارد شده و قلمA را مشاهده کرده است. سیستم میزان شباهت بردار قلم َA را با سایر اقلام BوC و D با استفاده از معیار کسینوس به دست میآورد و شبیهترین اقلام که در اینجا B و C میباشند را به او پیشنهاد میکند.
در (شکل شماره ۹) صفحهای از سایت آمازون قابل مشاهده است. در این صفحه کاربر میتواند با کلیک روی لینک Your Recommendation وارد صفحهای شود که میتواند پیشنهاداتی که به او ارائه میشود را توسط موضوع و خط تولید مورد دلخواهش فیلتر کند. همچنین میتواند محصولاتی که قبلا خریداری نموده یا به او پیشنهاد شده است را امتیازدهی کند[۴۵] .

شکل شماره ۹ : نمونه صفحهای از سایت آمازون[۴۵]

(شکل شماره ۱۰) ارائه پیشنهاد بر اساس کارت خرید مشتری را نشان میدهد. یعنی بر اساس محصولاتی که تا کنون خریداری نموده است برای او پیشنهاد تولید میشود [۴۵].

شکل شماره ۱۰: ارائه پیشنهاد بر اساس کارت خرید مشتری [۴۵]

فصل سوم
روش محتوا محور

۳- روش محتوا محور

۳-۱-پیشگفتار

در این پایان نامه از روش محتوا محور جهت ارتقاء روش فیلترینگ اشتراکی استفاده شده است. روش محتوا محور بر اساس ویژگیهای اقلام تعریف میشود. این روش بررسی میکند که اقلام مورد علاقه کاربر دارای چه خصوصیاتی بودهاند، سپس اقلام دارای خصوصیات مشابه را به او پیشنهاد میکند. محتوای اقلام بر حسب نوع آنها میتواند متفاوت باشد. مثلا ژانر فیلم، نوع کتاب و مختصات جغرافیایی رستوران را به ترتیب به عنوان محتوای اقلام فیلم، کتاب یا رستوران در نظر گرفت. به عنوان مثال اگر اکثر فیلمهایی که کاربر دیده است متعلق به ژانر مستند باشند بدین معناست که او به این گونه فیلمها علاقهمند است.
سیستمهای محتوا محور نیاز به تکنیکی جهت نمایش خصوصیات اقلام، ایجاد نمایه از کاربر بر اساس علاقهمندیهایش و یک استراتژی جهت مقایسه نمایه کاربر با خصوصیات اقلام میباشد.

۳-۲- روند کار روش محتوا محور

روند کار سیستمهای محتوا محور به این صورت است که ابتدا براساس نحوه امتیازدهی کاربر به اقلام مختلف، نمایهای از علائق او ساخته میشود. سپس بر اساس میزان تطابق خصوصیات اقلام با نمایه ساخته شده از کاربر، پیشنهادها به کاربر ارائه میشود.
ساختار سیستمهای پیشنهادگر محتوا محور در شکل زیر نشان داده شده است.

شکل شماره ۱۱: روند کار روش محتوا محور [۲۴]

همانگونه که در شکل بالا قابل مشاهده است روند کار در متد محتوا محور متشکل از سه مرحله به شرح زیر می باشد [۲۴]:

۳-۲-۱- تحلیلگر محتوا (Content Analyzer)

در این مرحله محتوای اقلام نشان داده میشود. بدین منظور معمولا از تکنیکهای بازیابی اطلاعات استفاده میشود. اطلاعات توصیفی سازماندهی نشده مربوط به اقلام از قسمت منبع اطلاعات (Information Source) استخراج شده و در این مرحله سازماندهی میشود. یعنی هر قلم توسط اطلاعات سازماندهی شده نمایش داده میشود. مثلا اگر سیستم پیشنهادگر مربوط به فیلم باشد هر فیلم میتواند توسط ویژگیهای مربوط به بازیگران، کارگردانان و…. نمایش داده شود. یا اگر سیستم پیشنهادگر مربوط به صفحه وب باشد هر صفحه وب میتواند توسط برداری از کلمات کلیدی نمایش داده شود. به این صورت که ریشه کلمات به عنوان خصوصیات و مقدار tf/idf مربوط به هر ریشه به عنوان مقدار آن در نظر گرفته شود.
نتیجه حاصل شده از این مرحله در قسمت اقلام نمایش داده شده
(Represented Items) ذخیره میشود.

۳-۲-۲- یاد گیرنده نمایه (Profile Learner)

در این مرحله بر اساس عکس العملی که کاربر در برابر اقلام مختلف نشان داده و در قسمت بازخورد (Feedback) ذخیره شده است، نمایهای از علائق او ساخته میشود. این کار معمولا توسط تکنیکهای موجود در حوزه یادگیری ماشین انجام میشود.
عکس العملی که کاربر در مقابل اقلام از خود نشان میدهد به دو صورت صریح و ضمنی میباشد. عکس العمل صریح به این صوت است که کاربر علاقه یا عدم علاقه خود نسبت به اقلام را توسط امتیازدهی یا توصیفی کوتاه نشان دهد. در عکس العمل ضمنی کاربر هیچ دخالتی ندارد و خود سیستم توسط کنترل و تحلیل رفتار و فعالیتهای کاربر، علائق او را استخراج میکند.
با توجه به اینکه سلیقه افراد در طول زمان تغییر میکند، نمایه ساخته شده از کابر نیز باید با توجه به این تغییرات به روز شود. برای این منظور ابراز علاقه و یا عدم علاقه کاربر به اقلامی که در لیست به او پیشنهاد شدهاند به عنوان باز خورد ذخیره و برای به روز کردن نمایه او استفاده میشود.
درست است که سایت پیشنهادگر آمازون بر اساس روش فیلترینگ اشتراکی است. ولی همانطور که در شکل شماره ۱۲ قابل مشاهده است در این نمونه صفحه از سایت آمازون گزینهای به نام Youre Favoites وجود دارد که با استفاده از این گزینه قسمتی از نمایه کاربر میتواند بر اساس روش محتوا محور ساخته شود. همانگونه که در شکل شماره ۱۳ قابل مشاهده است در این صفحه انواع کتابهایی که مطابق با علائق کاربر است نمایش داده شده است. انواعی که در این قسمت قابل مشاهده است یا به صورت ضمنی بر گرفته شده، مانند بررسی اقلامی که کاربر تا کنون خریداری کرده است، یا به صورت دستی توسط خود کاربر وارد شده است. این قسمت توسط کاربر قابل ویرایش و تطبیق پذیر با سلایق و علائق او میباشد.

شکل شماره ۱۲ : نمونه صفحهای از سایت آمازون

شکل شماره ۱۳ : استفاده از روش محتوا محور در سایت آمازون

۳-۲-۳- جزء فیلترینگ (filtering component )

در این مرحله میزان شباهت پروفایل ساخته شده از کاربر با اطلاعات توصیفی سازماندهی شده اقلام مورد نظر سنجیده میشود. این کار میتواند توسط یکی از معیارهای اندازه گیری شباهت مانند معیار اندازه گیری کسینوس صورت گیرد. بر این اساس مشخص میشود که کدام یک از این اقلام مورد علاقه کاربر است. نتیجه حاصل شده از این مرحله یک لیست پیشنهادی از اقلام میباشد که بر اساس علائق کاربر مرتب شده است.

۳-۳- مزایای روش محتوا محور

متد محتوا محور در مقایسه با متد فیلترینگ اشتراکی دارای مزایایی به شرح زیر است:

۳-۳-۱- استقلال کاربر

متد محتوا محور به امتیازهای کاربر فعال برای ساختن نمایه از او احتیاج دارد. در حالی که متد فیلترینگ اشتراکی به امتیازهای کاربران همسایه برای تشکیل مجموعه همسایگی کاربر فعال نیاز دارد.

۳-۳-۲-شفافیت

دسته بندی : No category

دیدگاهتان را بنویسید