Появление более быстрых алгоритмов обнаружения объектов

Если вы когда-либо использовали обнаружение объектов, то наверняка знаете об алгоритмах YOLO и SSD. Хотя эти алгоритмы являются одними из лучших, они по-прежнему медленны или слишком велики для небольших устройств с ограниченной памятью и вычислительной мощностью.

Здесь появляется FOMO.

Исследователь из Edge Impulse разработал FOMO — новый алгоритм машинного обучения, который может выполнять обнаружение объектов на ограниченных устройствах. Он позволяет подсчитывать объекты, находить местоположение объектов на изображении и отслеживать несколько объектов в режиме реального времени, используя до 30 раз меньше вычислительной мощности и памяти, чем MobileNet SSD или YOLOv5.

Итак, как это работает?

FOMO работает как модель классификации изображений, но в своих последних слоях состоит из карты вероятности класса для каждого региона. Затем он использует пользовательскую функцию потерь, чтобы сохранить местоположение конечного слоя, давая вам тепловую карту того, где находятся объекты на изображении.

Подробнее об этом читайте в их официальной документации: https://docs.edgeimpulse.com/docs/tutorials/fomo-object-detection-for-constrained-devices

Ограничения

  • Полезно, когда камера зафиксирована.
  • Все объекты одинакового размера.
  • Объекты не должны перекрываться, но изображение с более высоким разрешением может решить эту проблему.

Несколько слов

С тех пор, как я узнал обо всех различных алгоритмах обнаружения объектов, я задавался вопросом, когда, как и что приведет нас к решениям, которые требуют меньше вычислений и, следовательно, более применимы в нашей повседневной жизни, и кажется, что инновации никогда не умрут. В тот момент, когда я где-то наткнулся на заголовок «FOMO: Faster Objects, More Objects», я был рад узнать больше, и, прочитав его на их сайте, я подумал о том, чтобы распространить информацию среди более широкой аудитории, и вот мы здесь!.

Это мой первый блог, и я надеюсь, что вы были слишком взволнованы, чтобы узнать об этом больше.

Спасибо.

[1]: ИМПУЛЬС КРАЯ. FOMO: Обнаружение объектов для ограниченных устройств. https://docs.edgeimpulse.com/docs/tutorials/fomo-object-detection-for-constrained-devices

[2]: Краевой импульс. YouTube. Объявление FOMO. https://www.youtube.com/watch?v=iazSrguEL7g