Я пытаюсь создать рекомендательную систему, используя scala API для apache-spark.
У меня есть набор данных в форме (Пользователь, Продукт, Рейтинг) для всех элементов, которые оценили все пользователи. Чтобы дать рекомендации, мне нужен набор данных вида (U,P) со всеми парами U,P, которых нет в моем исходном наборе данных. (пары user,product для всех товаров, которые не купил каждый пользователь). кто-нибудь знает какой-либо прямой способ сделать это?
ps- Вы можете предположить, что нет других пользователей или элементов, кроме тех, что в исходном наборе.
Любая помощь будет оценена.