В предыдущем сообщении в блоге (Понимание прогнозов сверточных нейронных сетей: карты значимости) мы обсудили важность понимания того, как модели глубокого обучения получают свои прогнозы, особенно в контексте сверточных нейронных сетей (CNN), используемых для классификации изображений. задания. Мы изучили документ Глубоко внутри сверточных сетей: визуализация моделей классификации изображений и карт значимости, который предоставил способ визуализации активации функций CNN и определения областей изображения, которые наиболее важны для предсказания сети. Однако у этого подхода были ограничения, такие как тенденция к созданию зашумленных карт значимости, которые может быть трудно интерпретировать. В этом посте мы рассмотрим документ, который устраняет это ограничение, представляя метод SmoothGrad, который удаляет шум путем добавления шума.

Введение в метод SmoothGrad

В статье SmoothGrad: устранение шума путем добавления шума (ICML 2017)» метод SmoothGrad представлен как способ улучшить интерпретируемость CNN. Метод включает в себя добавление шума к входному изображению и создание нескольких карт заметности, каждая из которых соответствует слегка отличающейся зашумленной версии входного изображения. Затем карты заметности усредняются для получения сглаженной карты значимости, на которую меньше влияет шум. Мы увидим более подробную информацию о методе в следующих разделах.

Проблемы с картами значимости

Карты важности — это популярный метод визуализации областей изображения, которые наиболее важны для предсказания сети. Однако карты заметности могут быть зашумленными и трудными для интерпретации,особенно когда показатели значимости малы. Это связано с тем, что небольшие возмущения входного изображения могут вызвать большие изменения в выходных данных сети, что приводит к зашумленным картам значимости, которые трудно интерпретировать.

Использование метода SmoothGrad для уменьшения шума

Метод SmoothGrad решает проблему шума, добавляя шум к входному изображению. Создавая несколько карт значимости из разных зашумленных версий входного изображения, метод может усреднять шум и создавать сглаженную карту значимости, которая более интерпретируема.

Чтобы реализовать SmoothGrad, авторы добавляют гауссовский шум к входному изображению и вычисляют карту значимости для каждой зашумленной версии изображения. Затем карты значимости усредняются для получения сглаженной карты значимости. Добавляя шум, метод способен уменьшить влияние небольших искажений на входное изображение, что приводит к более стабильной и интерпретируемой карте значимости. Математически это означает вычисление:

Заключение

В этом посте мы рассмотрели метод SmoothGrad, который решает проблему шума в картах значимости, добавляя шум к входному изображению и создавая несколько карт значимости, которые усредняются для создания сглаженной карты значимости. Этот метод имеет важное применение в задачах классификации изображений, где важно понимать, как сеть делает свои прогнозы. Используя метод SmoothGrad, мы можем создавать сглаженные карты значимости, которые легче интерпретировать, и получить более глубокое представление о том, как работают CNN. В целом метод SmoothGrad является значительным вкладом в область глубокого обучения и открывает новые возможности для исследований в области понимания и интерпретации CNN.