Генериране на набор от тестови данни за система за препоръки от съществуващи данни

Опитвам се да изградя препоръчителна система, използвайки scala API за apache-spark.

Имам набор от данни във формата (Потребител, Продукт, Оценка) за всички елементи, които всички потребители са оценили. За да дам препоръки, имам нужда от набор от данни във формата (U,P) с всички U,P двойки, които не присъстват в първоначалния ми набор от данни. (потребител, двойки продукти за всички продукти, които всеки потребител не е купил). някой да знае някакъв пряк начин да направите това?

ps- Можете да приемете, че няма други потребители или елементи освен тези в първоначалния набор.

Всяка помощ ще бъде оценена.


person shahharsh2603    schedule 24.06.2014    source източник


Отговори (1)


Този урок може да бъде много полезен за вас:

http://ampcamp.berkeley.edu/big-data-mini-course/movie-recommendation-with-mllib.html

person Germán Alfaro    schedule 15.07.2014