Нормализация данных в задаче классификации временных рядов - Рекуррентные нейронные сети

Я работаю над проблемой, когда мне нужно предсказать один из нескольких выходных классов на основе данных датчика движения с использованием LSTM. Есть два разных датчика, каждый с тремя каналами и с разными единицами измерения. Для каждой записи я использую минимальную и максимальную нормализацию, чтобы привести уровни датчика амплитуды в диапазон от 0 до 1 (для каждого датчика индивидуально).

Делая это, я вижу, что при использовании нормализации моя сеть действительно быстрее сходится к конечному значению (с точки зрения точности), но производительность значительно ниже по сравнению с использованием ненормализованных данных для той же настройки сети.

Насколько я понимаю, нормализация имеет то преимущество, что помогает в обучении, но если кто-то получает преимущество в производительности, действительно ли необходимо придерживаться использования менее производительной сети, которая принимает нормализованные входные данные. Я не такой опытный и хотел бы, чтобы другие люди прокомментировали это.

Спасибо!


person Syeman    schedule 28.12.2020    source источник


Ответы (1)


Я бы использовал более производительную сеть, если это является основным приоритетом. Цель нормализации, как правило, заключается в том, чтобы ваши потери не взорвались во время тренировки. Таким образом, это часто улучшает результаты, когда значения очень велики. Однако иногда, когда значения уже малы, нормализация усугубит ситуацию. Также возможно, что ваш диапазон значений слишком мал. Возможно, вы захотите попробовать нормализовать между (0, 2) или большим диапазоном. Но если производительность уже удовлетворительна без нормализации, я бы не стал заморачиваться.

person igodfried    schedule 30.12.2020
comment
Спасибо большое! Попробую изменить диапазон. Если я смогу получить производительность, близкую к ненормализованным данным, я оставлю нормализованные значения. - person Syeman; 01.01.2021