ПОНИМАНИЕ МЕТОДОВ XAI

Методы XAI — деконволюция

Что такое деконволюция? Как он использует структуру CNN для интерпретируемости?

Что такое деконволюция?

Идея Деконволюции [2] взята из работы Zeiler et al. [1] о деконволюционных сетях (деконволюционные сети}). Сети деконволюции предназначены для работы аналогично сверточным сетям, но в компонент фильтра и т. д.), и их можно обучать, используя неконтролируемый подход. При деконволюционном подходе к объяснению модели мы не обучаем деконнет, а скорее тестируем с его помощью нашу CNN.

Чтобы реконструировать активацию на определенном слое, мы присоединяем слои deconv к соответствующим слоям CNN (см. Рис. 1). Затем изображение передается через CNN, и сеть вычисляет результат. Чтобы проверить реконструкцию для данного класса c, мы должны установить все активации, кроме той, которая отвечает за прогнозирование класса, равными нулю. Затем мы можем пройти через слои deconnet и передать все карты объектов в качестве входных данных для соответствующих слоев.

Чтобы рассчитать реконструкцию, уровень deconnet должен быть в состоянии отменить операции, выполняемые уровнями CNN. Авторы разработали специальные компоненты для компоновки обратных операций, выполняемых слоями CNN:

Фильтрация

Фильтрация в исходном CNN вычисляет карты объектов с использованием изученных фильтров. Для обращения этой операции требуется использование транспонированной версии тех же фильтров. Затем эти транспонированные фильтры применяются к исправленным не объединенным картам.

Исправление

Исправление использует ту же нелинейность ReLU [4] для вычисления Исправленных карт без пула, что и в CNN. Это просто исправление значений и распространение только неотрицательных значений на слой filtering.

Распаковка

Unpooling соответствует Pooling Layer CNN (см. Рис. 2). Исходная операция максимального объединения необратима, но в этом подходе используются дополнительные переменные, называемые переменными переменными, которые отвечают за запоминание местоположения максимумов для каждой области объединения. Слой распаковки использует эти переменные для реконструкции в тех же местоположениях, что и при расчете объединения.

Распространение по всей деконсети дает нам представление признаков из первого слоя исходной CNN (последний слой деконсети соответствует первому слою CNN). Такой подход приводит к тому, что карта значимости имеет некоторые смещения из первого сверточного слоя, и представление выглядит как локализованный детектор границ (см. Рис. 3). Обычно это работает лучше, когда есть четкое различие в важности признаков, а не одинаковые значения для всего изображения.

Использованная литература:

  1. М. Д. Зейлер, Г. В. Тейлор, Р. Фергус. Адаптивные деконволюционные сети для изучения признаков среднего и высокого уровня, 2011.
  2. Д. Цейлер, Р. Фергус. Визуализация и понимание сверточных сетей, 2013.
  3. А. Хосла, Н. Джаядевапракаш, Б. Яо, Л. Фей-Фей. Набор данных Стэнфордских собак. https://www.kaggle.com/jessicali9530/stanford-dogs-dataset, 2019 г. Дата обращения: 01.10.2021.
  4. Р. Ханлозер, Р. Сарпешкар, М. Маховальд, Р. Дж. Дуглас, С. Сын. Цифровая селекция и аналоговое усиление сосуществуют в кремниевой схеме, вдохновленной кортексом, 2000.

Первоначально опубликовано на https://erdem.pl.