Создание набора тестовых данных для системы рекомендаций из существующих данных

Я пытаюсь создать рекомендательную систему, используя scala API для apache-spark.

У меня есть набор данных в форме (Пользователь, Продукт, Рейтинг) для всех элементов, которые оценили все пользователи. Чтобы дать рекомендации, мне нужен набор данных вида (U,P) со всеми парами U,P, которых нет в моем исходном наборе данных. (пары user,product для всех товаров, которые не купил каждый пользователь). кто-нибудь знает какой-либо прямой способ сделать это?

ps- Вы можете предположить, что нет других пользователей или элементов, кроме тех, что в исходном наборе.

Любая помощь будет оценена.


person shahharsh2603    schedule 24.06.2014    source источник


Ответы (1)


Этот урок может быть очень полезен для вас:

http://ampcamp.berkeley.edu/big-data-mini-course/movie-recommendation-with-mllib.html

person Germán Alfaro    schedule 15.07.2014