Архитектура

RCCN состоит из трех модулей:

  • Первый генерирует независимые от категорий предложения регионов. Эти предложения определяют набор обнаружений-кандидатов, доступных нашему детектору.
  • Второй модуль — это большая сверточная нейронная сеть, которая извлекает вектор признаков фиксированной длины из каждой области.
  • Третий модуль представляет собой набор линейных SVM для конкретных классов.

В то время как R-CNN не зависит от метода предложения конкретного региона, выборочный поиск является наиболее часто используемым методом для обеспечения контролируемого сравнения с предыдущей работой по обнаружению.

Выполнение

Во время тестирования мы запускаем выборочный поиск изображений, чтобы извлечь около 2000 предложений по регионам. Мы деформируем каждое предложение и передаем его через CNN для вычисления характеристик. Затем для каждого класса мы оцениваем каждый извлеченный вектор признаков, используя SVM, обученный для этого класса. Учитывая все оцененные области в изображении, мы применяем жадное немаксимальное подавление (для каждого класса независимо), которое отклоняет область, если она имеет пересечение над объединением (IoU), перекрывающееся с выбранной областью с более высокой оценкой, превышающей изученный порог.

Бумага

Богатая иерархия функций для точного обнаружения объектов и семантической сегментации 1311.2524

Просмотреть все темы этой серии здесь