Мнение

Проблемы платформ машинного обучения для автономных транспортных средств

Автономные транспортные средства (АВ) — это будущее мобильности. Благодаря недавним технологическим прорывам они больше не существуют только в научно-фантастических фильмах или технических демонстрациях. Сегодня на улицах мегаполисов можно увидеть автономные транспортные средства, предоставляющие услуги роботакси.

Из-за большого успеха глубокого обучения в последнее десятилетие программное обеспечение, которое служит мозгом AV, в значительной степени перешло от алгоритмов, основанных на правилах, к алгоритмам машинного обучения (ML), управляемого данными. Сегодня машинное обучение проникло почти на каждый этап проектирования автономных транспортных средств: от восприятия, прогнозирования поведения, планирования движения до управления, картирования и маршрутизации и т. д.

Роль платформы машинного обучения

Чрезвычайно высокие требования к безопасности для AV устанавливают высокие стандарты для алгоритмов ML на каждом этапе системы. Повышение точности на 1% в модели ML может указывать на значительное улучшение безопасности вождения и/или снижение вероятности ненужного застревания транспортного средства на мель. По этим причинам специалисты по машинному обучению в AV-компаниях изо всех сил стараются раздвинуть границы современных моделей (SOTA). В то же время эти модели также должны соответствовать бортовым устройствам транспортных средств и соответствовать ограничениям по задержке, памяти и мощности.

Учитывая такие сложные и сложные цели разработки моделей машинного обучения, роль платформы машинного обучения состоит в том, чтобы предоставить упрощенный интерфейс базовой инфраструктуры машинного обучения, чтобы специалисты-практики машинного обучения, имеющие опыт моделирования, могли больше сосредоточиться на разработке и совершенствовании алгоритмов машинного обучения.

Проблемы дизайна

В дополнение к более удобному использованию и эффективности использования ресурсов в качестве целей, желаемых другими отраслями, такими как таргетинг рекламы и системы рекомендаций, дизайн платформы ML в индустрии автономных транспортных средств сталкивается с некоторыми уникальными проблемами:

Интеллектуальный анализ данных Oceansize

Из-за характера источников данных, таких как лидар дальнего и ближнего действия, панорамные видеокамеры, обнаружение радаров, окружающий звук, дорожная карта высокой четкости и т. д., размер обучающих данных огромен. С одной стороны, необработанные данные очень ценны для улучшения качества модели, но их получение дорого; с другой стороны, некоторые события происходят крайне редко, что делает набор данных крайне несбалансированным. Проблемы заключаются не только в том, как эффективно хранить и передавать данные, но и в том, как разумно идентифицировать интересные события из этого огромного пространства данных.

Гетерогенные модели

Система машинного обучения для AV действительно мультимодальна и многозадачна. Модальность обучающих данных включает в себя 3D-облака точек, 2D-видео, сканирование радаров, дорожный график высокой четкости и табличные данные, такие как состояние дороги, ограничение скорости, информация о дорожном движении, погода и т. д. Каждая модель может быть обучена для различных задач, включая обнаружение пешеходов, обнаружение транспортных средств, обнаружение ложных объектов (таких как ветки на обочине дороги) и т. д. Поскольку мы наблюдаем тенденцию перехода сетевой архитектуры к магистрали на основе трансформатора, мы ожидаем большей консолидации модельных задач в нескольких репрезентативных моделях. В то же время, даже для одной и той же задачи, такой как прогнозирование поведения, прогнозирование поведения пешехода и транспортного средства может потребовать разных алгоритмов моделирования.

Хотя существует значительное желание построить и обучить сквозную модель (от данных датчиков до конечных сигналов управления транспортным средством) для автономных транспортных средств, в ближайшем будущем это может оказаться неосуществимым из-за предела задержки вывода на борту и модели. требование объяснимости для каждого этапа.

Эффективность обучения

Учитывая непомерно большой размер обучающих данных и частое развитие алгоритмов моделирования, платформа машинного обучения должна предоставлять решение, позволяющее специалистам по машинному обучению быстро повторять цикл разработки модели и в то же время эффективно использовать вычислительные ресурсы. Поскольку большинство моделей автономных транспортных средств необходимо обучать на кластерах специализированных ускорителей, таких как GPU, TPU и т. д., хорошая платформа машинного обучения должна проектировать эффективную распределенную инфраструктуру обучения, но без необходимости ручной настройки специалистами-практиками машинного обучения. это просто в использовании.

С другой стороны, конвейер обучающих данных также может быть узким местом вычислений из-за различных требований к обработке и дополнению данных. Платформа машинного обучения должна обеспечивать эффективный конвейер обработки входных данных, чтобы ускорителям не хватало обучающих данных.

Встроенная оптимизация логических выводов

С одной стороны, точность модели может изменить правила игры для безопасности автономных транспортных средств и успеха в бизнесе; с другой стороны, после того, как качественная модель обучена, как развернуть ее в автомобиле (или на борту), чтобы она могла помочь принять решение о вождении в пределах требуемых задержек (часто менее 100 миллисекунд).

Как по физическим, так и по стоимостным ограничениям автономный автомобиль не может иметь на борту неограниченные вычислительные ресурсы. Существуют также последовательные зависимости между моделями (например, некоторые модели восприятия необходимо запускать перед моделями поведения), работающими на автомобиле. Это становится проблемой оптимизации с временными ограничениями на графе потока данных. Оптимизация задержки должна быть выполнена в первую очередь на критических по времени путях. Можно использовать различные методы оптимизации вывода модели, такие как сокращение сети, квантование модели и т. д., однако, в отличие от некоторых случаев Edge ML, точность модели не может быть скомпрометирована.

Опять же, хорошая платформа машинного обучения должна предоставлять такие решения по оптимизации для специалистов по машинному обучению, чтобы они были уверены, что модели, которые они обучили, могут быть успешно развернуты на автомобиле без потери точности.

Требование к специальному обучению

Из-за сложности обучения высококачественных моделей и развертывания их в автомобиле с жесткими ограничениями задержки хорошая платформа машинного обучения должна предоставлять различные решения для специалистов по машинному обучению. Например, решение для поиска нейронной архитектуры (NAS) для поиска хорошей архитектуры модели, обеспечивающей высокую точность, но отвечающей ограничениям задержки вывода. Или решение для дистилляции, которое обучает большую и точную модель вне системы и выделяет меньшую, но столь же точную модель для развертывания на борту.

Будущее

Будущее мобильности наступает. В крупных городах, таких как Сан-Франциско и Феникс, мы уже видим полностью автономные такси, курсирующие по улицам и обслуживающие тысячи пассажиров — представителей общественности. Мы ожидаем быстрого увеличения таких парков в ближайшем будущем, а также автономных транспортных средств в других областях, таких как грузоперевозки и местные поставки.

Осуществимость и масштабируемость этой отрасли требуют постоянного совершенствования алгоритмов моделей глубокого обучения и хорошей платформы машинного обучения, которая поддерживает эффективный анализ данных, более быструю итерацию модели и оптимальное развертывание. Когда индустрия автономных транспортных средств распространится на гораздо большее количество автомобилей и геолокаций, платформы машинного обучения также должны поддерживать непрерывное обучение и лучшую интеграцию с моделированием.

Отказ от ответственности. Это личное мнение автора. Любые предположения и мнения, изложенные здесь, принадлежат им и не являются репрезентативными для их нынешнего или любого предыдущего работодателя(ов).