Опитваме се да намерим сходство между елементи (и по-късни потребители), където елементите са класирани в различни списъци от потребители (помислете за Роб, Бари и Дик в Здравей Fidelity). По-нисък индекс в даден списък предполага по-висок рейтинг.
Предполагам, че стандартният подход би бил да се използва корелацията на Pearson и след това да се обърнат индексите по някакъв начин.
Въпреки това, както разбирам, целта на корелацията на Pearson е да компенсира разликите между потребителите, които обикновено оценяват нещата по-високо или по-ниско, но имат подобни относителни оценки.
Струва ми се, че ако списъците са непрекъснати (макар и с произволна дължина), не е проблем, че оценките, подразбиращи се от позицията, ще бъдат изкривени по този начин.
Предполагам, че в този случай евклидово базирано сходство би било достатъчно. такъв ли е случаят Дали използването на корелацията на Pearson би имало отрицателен ефект и би ли намерила корелация, която не е подходяща? Каква мярка за сходство може да отговаря най-добре на тези данни?
Освен това, въпреки че искаме позицията в списъка да има ефект, ние не искаме да наказваме класациите, които са твърде далеч едно от друго. Двама потребители, и двамата представящи елемент в списък с много различно класиране, все още трябва да се считат за подобни.