Точечное и парное обучение ранжированию данных с бинарными значениями релевантности

У меня есть два вопроса о различиях между точечными и парными алгоритмами обучения для ранжирования ДАННЫХ С ДВОЙНЫМИ ЗНАЧЕНИЯМИ РЕЛЕВАНТНОСТИ (0 и 1). Предположим, что функция потерь для парного алгоритма вычисляет, сколько раз запись с меткой 0 ранжируется перед записью с меткой 1, а функция потерь для точечного алгоритма вычисляет общую разницу между оценочными значениями релевантности и фактическими значениями релевантности.

Итак, мои вопросы: 1) теоретически две группы алгоритмов будут работать значительно по-разному? 2) будет ли парный алгоритм деградировать до точечного алгоритма при таких настройках?

Благодарность!


person MYP    schedule 22.08.2018    source источник


Ответы (1)


При точечной оценке ошибки в строках ваших данных (строки с элементами и пользователями, вы хотите ранжировать элементы в каждом пользователе/запросе) считаются независимыми типами нормально распределенных ошибок. Принимая во внимание, что при попарной оценке часто используемой функцией потерь алгоритма является перекрестная энтропия - относительная мера точной классификации 1 как 1 и 0 как 0 в каждой паре (с информацией - т.е. один из элементов лучше, чем другой в паре).

Таким образом, изменения заключаются в том, что парный метод, вероятно, будет учиться лучше, чем точечный.

Единственное исключение, которое я мог видеть, - это бизнес-сценарий, когда пользователи нажимают на элементы, не оценивая/сравнивая элементы друг с другом за каждое слово. Хотя это очень маловероятно.

person narasimha.m    schedule 14.09.2018