YOLOv4-Tiny для обнаружения объектов в реальном времени

При обнаружении объектов высокая точность не является единственной целью. Мы хотим, чтобы наша модель имела высокую скорость обнаружения, а также простоту использования. Вы только посмотрите один раз (YOLO) — одна из таких моделей с одношаговой структурой для обнаружения объектов. Он может обнаруживать и классифицировать объекты на более высокой скорости. В последнее время уровень развития YOLOv4 показал превосходную производительность.

Прежде чем мы перейдем к YOLOv4-tiny, нам нужно понять базовую структуру сети для YOLOv4.

Сеть YOLOv4 состоит из трех частей.

1. Магистральная сеть: YOLOv4 использует CSPDarknet53 в качестве базовой сети для обнаружения объектов.

2. Шейка: YOLOv4 использует объединение пространственных пирамид (SPP) в сочетании с сетью агрегации путей (PANet) в качестве шеи для извлечения различные слои карты объектов.

3. Голова: YOLOv4 использует голову YOLO в качестве основной головы.

Теперь давайте попробуем понять значение крошечной сети YOLOv4 и структуру сети.

Что такое YOLOv4-Tiny?

YOLOv4 tiny — это более простая модель, чем YOLOv4, что делает ее подходящей для использования в ограниченной компьютерной среде. Это может быть встроенное устройство или даже мобильное приложение. Сеть YOLOv4-tiny имеет две головки YOLO, в отличие от трех головок в YOLOv4, и YOLOv4-tiny обучается на 29 предварительных сверточных слоях, тогда как YOLOv4 обучается на 137 предварительных сверточных слоях.

YOLOv4 tiny имеет более высокую скорость обнаружения объектов, которая может достигать 371 кадра в секунду (FPS) с использованием графического процессора 1080Ti. Эта сеть подходит для приложений реального времени из-за ее высокой точности и высокой скорости помех. Хотя его точность составляет 2/3 от YOLOv4 из-за высокой скорости помех, его можно использовать для создания быстрой модели.

Структура сети для YOLOv4-Tiny

YOLOv4-tiny использует сеть CSPDarknet53-tiny в качестве своей магистральной сети, в отличие от YOLOv4, который использует CSPDarknet53 в качестве своей магистральной сети. Сеть CSPDarknet53 — это сверточная нейронная сеть, представляющая собой комбинацию частичной сети Cross stage (CSPNet) и модели darknet53. Как правило, модель обнаружения объектов имеет более высокую вычислительную сложность и требует больше времени вычислений. CSP снижает вычислительную сложность, разделяя входной базовый слой на две части. Первая часть обходит плотный блок. В то время как вторая часть проходит через плотный блок, а затем становится объединенным входом с первой частью для следующего переходного слоя, как показано на диаграмме ниже. Это помогает снизить вычислительную сложность сети за счет разделения входных данных на две части.

В этой статье мы рассказали о преимуществах использования сети YOLOv4-tiny для обнаружения объектов и базовых знаниях о ее сетевой структуре. В этой статье показано, что для реального применения сетей обнаружения объектов скорость обнаружения не менее или даже важнее, чем точность обнаружения, и поэтому YOLOv4-Tiny показал потрясающую производительность.

YOLOv4-Tiny для обнаружения объектов в реальном времени

Вопросы по теме