Я хотел бы взвесить все мои значения PearsonItemSimilarity между двумя предметами по количеству общих оценок, деленных на 50.
Или, другими словами, обновите общее сходство Пирсона между двумя элементами (например, элементами a и b) соответствующим образом -- подобие_new_ab = сходство_ab*numCoRatings_ab/50
Как получить количество сопоставлений между двумя играми, используя существующую структуру mahout.
Может ли кто-нибудь связать меня (или проиллюстрировать) с примером реализации rescorer?
Мои доводы в пользу этого следующие:
Я утверждаю, что большинство рассчитанных подобий Пирсона основаны на небольшом количестве (в большинстве случаев 1 или 2) коратингов. Это привело бы к тому, что игры имели бы общую корреляцию Пирсона, равную 1, друг с другом, чего на самом деле, вероятно, не было бы, если бы существовало больше коратингов.
Чтобы объяснить это, я хотел бы изменить эти «наивные» сходства Пирсона на сходство, которое также основано на количестве совместных оценок.
Я думал, что это то, для чего был создан счетчик, но, похоже, я ошибался.