Формат файла предсказания в vowpal wabbit с начальной загрузкой

Я использую VW 7.4 для бинарной классификации:

cat train | vw -k --binary --cache_file cache -f model --compressed --passes 10 --loss_function hinge

Во время тестирования я могу получить доступ к результатам, используя:

cat test | vw -t -i model -p pred

Чего я не понимаю, так это того, что если я добавлю --bootstrap 4 к обучению, то результирующий файл pred будет содержать 3 столбца. Я не знаю, какой из них соответствует баллам прогноза.


person mossaab    schedule 18.07.2014    source источник


Ответы (1)


При использовании --bootstrap <N> vowpal-wabbit добавляет доверительный интервал [мин. макс.], полученный в результате нескольких выборок начальной загрузки, к каждой строке прогноза:

prediction tag min max

Первые два поля остаются такими же, как и без --bootstrap:

prediction tag

(tag является необязательным; оно повторяется из соответствующего примера в наборе данных, и его использование рекомендуется)

Более подробную информацию о новых возможностях, которые он внес, можно найти на слайдах презентации Чжэня Циня. (включая, но не ограничиваясь --bootstrap)

Не связано, но должно быть упомянуто:

Вам не нужно кормить vowpal-wabbit из stdin с помощью cat file |< /а>. Вы можете сохранить процесс, передав файл набора данных непосредственно в vw:

vw ... filename
person arielf - Reinstate Monica    schedule 20.07.2014