Получить окружение пользователя из дополнительных данных в совместной фильтрации

Я хотел сделать рекомендацию на основе нескольких наборов данных, например, с использованием нескольких, взвешенные модели данных для рекомендателя Mahout

Но моя проблема в том, что дополнительные наборы данных плохо переводятся в основные элементы. Мой домен специфичен, но представьте себе, что это проблема рекомендации фильмов, также основанных на музыкальном вкусе.

Если я одинаково отношусь к фильмам и музыке, то в результате получу и музыку.

Я хотел бы использовать другие наборы данных только для улучшения соседства. Возможно ли это с Mahout или Myrrix?


person Hurda    schedule 10.04.2013    source источник


Ответы (1)


Если вы относитесь к ним одинаково, вы можете использовать Rescorer, чтобы отфильтровать результаты музыки. Myrrix также имеет доступ к Rescorer(ам)

Например, этот Rescorer пример< /a> из книги Mahout in Action отфильтровывает из рекомендаций книги, которых нет в наличии. Вы могли бы сделать что-то подобное, где бы вы (каким-то образом) отслеживали, какие идентификаторы предметов являются музыкой, а затем использовали эту информацию в Rescorer, чтобы отфильтровать их, чтобы они не рекомендовались.

person Julian Ortega    schedule 10.04.2013
comment
Вот так. В Myrrix также есть CandidateFilter, который устанавливает, какие элементы рекомендуются для любого запроса вообще (Rescorer больше для каждого запроса). Вы можете сделать это любым способом, но CandidateFilter может быть быстрее. - person Sean Owen; 10.04.2013
comment
Да, я не упомянул об этом, потому что это помечено как экспериментальное (пока). Мне также интересно, можно ли для этой цели использовать тег api, где вы пометите всех пользователей идентификаторами музыкальных элементов, что будет информировать модель и не будет возвращаться в рекомендации, как вы думаете? - person Julian Ortega; 10.04.2013
comment
Да тоже вполне возможно. Теги автоматически исключаются. Это тоже работает. Вы бы не хотели этого делать, только если бы когда-нибудь захотели порекомендовать музыку. Сохраняя их оба как элементы, вы можете делать и то, и другое, возможно, для каждого запроса. Тогда вы действительно будете использовать Rescorer. - person Sean Owen; 10.04.2013