Что такое допустимый диапазон ввода для сверточной нейронной сети?

Я использую архитектуру CONV-maxpool-CONV-maxpool-CONV-maxpool-CONV-maxpool-hidden-logistic для приложения обнаружения изображений. Хотя большинство примеров нормализуют интенсивность изображения до диапазона [0,1]. Но это кажется нехорошим, потому что среднее значение ввода не равно нулю. то есть не отбеленный ввод. Есть ли пробная версия для использования диапазона ввода [-0,5,0,5]?




Ответы (1)


Я видел много работ, использующих глобальную нормализацию контраста, которая состоит из нулевого центрирования данных и масштабирования, чтобы ваши функции имели единичную дисперсию. Это заставит ваши пиксели изображения лежать в симметричном интервале около 0, как вы сказали. Дополнительные «лучшие практики» см. в этой статье Лучшие практики для сверточных нейронных сетей, примененных к Распознавание объектов на изображениях.

person Indie AI    schedule 06.01.2016
comment
Я пробовал после загрузки вопросов. [-0,5,0,5] входное испытание было хуже, чем [0,1] испытание диапазона (сложно оптимизировать). Но я не знаю, почему. - person MJ.Shin; 12.01.2016