Бих искал да претегля всичките си стойности на PearsonItemSimilarity между два елемента по броя корации, които споделят, разделен на 50.
Или с други думи актуализирайте общото сходство на Pearson между два артикула (артикули a и b например) съответно -- similarity_new_ab = similarity_ab*numCoRatings_ab/50
Как се получава броя на корациите между две игри, като се използва съществуващата рамка на mahout.
Може ли някой, моля, да ме свърже с (или да илюстрира) примерна реализация на резултат?
Причината ми да направя това е следната,
Постулирам, че повечето от изчислените сходства на Pearson се основават на малък брой (1 или 2 в повечето случаи) покрития. Това би довело до това, че игрите споделят една с друга корелация на Pearson от 1, което всъщност вероятно няма да е така, ако съществуват повече coratings.
За да обясня това, бих искал да променя тези "наивни" прилики на Pearson с прилики, които също се основават на броя на съвместните оценки.
Мислех, че за това е създаден голмайсторът, но предполагам, че съм грешал.