У меня есть набор данных из 40 тыс. изображений из четырех разных стран. Изображения содержат разные предметы: сцены на открытом воздухе, городские сцены, меню и т. д. Я хотел использовать глубокое обучение для геотегирования изображений.
Я начал с небольшой сети из 3 слоев conv->relu->pool, а затем добавил еще 3, чтобы углубить сеть, поскольку задача обучения непростая.
Моя потеря связана с этим (как с 3-х, так и с 6-уровневыми сетями): :
Потери фактически начинаются плавно и снижаются в течение нескольких сотен шагов, но затем начинают подкрадываться.
Каковы возможные объяснения моего роста потерь?
Моя начальная скорость обучения очень низкая: 1e-6, но я также пробовал 1e-3|4|5. Я проверил дизайн сети на работоспособность на крошечном наборе данных из двух классов с предметами, отличными от классов, и потери постоянно снижаются по мере необходимости. Точность поезда колеблется на уровне ~40%