Вземете потребителски квартал от допълнителни данни в съвместното филтриране

Исках да направя препоръка въз основа на множество набори от данни като в Използване на множество, претеглени модели на данни за препоръчител на Mahout

Но моят проблем е, че допълнителните набори от данни не се превръщат добре в първични елементи. Моят домейн е специфичен, но си представете това като проблем с препоръчването на филми също въз основа на музикален вкус.

Ако третирам филмите и музиката по същия начин, ще получа и музика в резултатите.

Бих искал да използвам други набори от данни само за да получа по-добро съседство. Възможно ли е това с Mahout или Myrrix?


person Hurda    schedule 10.04.2013    source източник


Отговори (1)


Ако се отнасяте към тях по същия начин, можете да използвате Rescorer клас, за да филтрирате музикалните резултати. Myrrix също има достъп до Rescorer(s)

Например този Rescorer пример< /a> от книгата Mahout in Action филтрира от препоръките книгите, които не са в наличност. Бихте направили нещо подобно, където ще следите (по някакъв начин) кои идентификатори на елементи са музика и след това ще използвате тази информация в Rescorer, за да ги филтрирате, така че да не се препоръчват.

person Julian Ortega    schedule 10.04.2013
comment
Това е вярно. В Myrrix има и CandidateFilter, който установява кои елементи са препоръчителни за всяка заявка изобщо (Rescorer е по-скоро на заявка). Можете да го направите и по двата начина, но CandidateFilter може да бъде по-бърз. - person Sean Owen; 10.04.2013
comment
Да, не го споменах, защото е етикетирано като експериментално (засега). Също така се чудя дали маркерът API може да се използва за тази цел, където бихте маркирали всички потребители с идентификатори на музикални елементи, което ще информира модела и няма да се върне в препоръките, какво мислите? - person Julian Ortega; 10.04.2013
comment
Да, също е напълно възможно. Етикетите се изключват автоматично. Това също работи. Единствено не бихте искали да правите това, ако някога искате да препоръчате и музика. Като ги запазите и двете като елементи, можете да направите и двете, може би на базата на заявка. Тогава наистина ще използвате Rescorer. - person Sean Owen; 10.04.2013