Я тренирую полносвязную нейронную сеть для классификации набора данных MNIST. Входные данные представляют собой квадратные черно-белые изображения со значениями пикселей в [0, 255]
.
Я читал, что для использования активатора sigmoid()
нужно нормализовать ввод, чтобы он находился в [0, 1]
(диапазон сигмовидной).
Как нормализовать входные данные для активатора tanh()
? Нужно ли масштабировать его, чтобы он был в [-1, 1]
(диапазон tanh), или он все еще может быть в [0, 1]
.
Какой подход лучше и почему? Каково общее руководство?