Опитвам се да изградя препоръчителна система, използвайки scala API за apache-spark.
Имам набор от данни във формата (Потребител, Продукт, Оценка) за всички елементи, които всички потребители са оценили. За да дам препоръки, имам нужда от набор от данни във формата (U,P) с всички U,P двойки, които не присъстват в първоначалния ми набор от данни. (потребител, двойки продукти за всички продукти, които всеки потребител не е купил). някой да знае някакъв пряк начин да направите това?
ps- Можете да приемете, че няма други потребители или елементи освен тези в първоначалния набор.
Всяка помощ ще бъде оценена.