Zumo Labs представляет The Juice, еженедельный информационный бюллетень, посвященный проблемам компьютерного зрения (а иногда и обычным проблемам). Берите, пока свежо.

Неделя 12–16 июля 2021 г.

____

Мы обречены. Ледяные шапки тают, океаны поднимаются — явление, которое, по мнению НАСА, скоро усугубится из-за шатающейся орбиты Луны, — а глобальные температуры достигают рекордно высокого уровня. Можно ли считать сезон лесных пожаров сезоном, если он длится девять месяцев?

Но не бойтесь, нас спасет искусственный интеллект. Несмотря на то, что недавнее исследование показывает, что компьютерное зрение еще не прошло «фазу осведомленности, и только 10% компаний внедряют его до сих пор, некоторые уже обращаются к технологиям искусственного интеллекта, чтобы отсрочить антиутопию. Таймс сообщает о том, как огромное количество улучшенных погодных и спутниковых данных помогает системам ИИ лучше предсказывать, как будут гореть лесные пожары, когда они начнутся. И согласно этой статье в журнале Fortune есть надежда, что мобильные телефоны в наших карманах можно будет использовать для масштабируемой проверки инфраструктуры, чтобы предотвратить дальнейшие обрушения зданий, такие как в Surfside. Неудивительно, что Сундар Пичаи из Google недавно назвал ИИ самой глубокой технологией, которую человечество когда-либо будет разрабатывать и над которой будет работать.

Если нам удастся предотвратить катастрофу благодаря искусственному интеллекту, то, казалось бы, останется только одно. ИИ. Истории этой недели посвящены тому, как научить роботов ходить, целиться из оружия и пользоваться ножами. Прохладный.

____

#Чит код

Как далеко вы пойдете, чтобы улучшить свою игру Call of Duty? Если у вас есть деньги на первоклассный графический процессор и карту видеозахвата, этот необнаруживаемый чит с автоматическим прицеливанием на основе компьютерного зрения может быть для вас. Только одно: его создатель уже закрыл, привлек внимание (и, несомненно, строгое письмо от) Activision. Я бы сказал, что мошенники никогда не побеждают, но после этого, вероятно, найдется множество людей со сломанными контроллерами, которые скажут иначе.

Читер хвастается автоматическим прицеливанием компьютерного зрения, которое работает в «любой игре», через Ars Technica.

#БосаяCNNTessa

Эксперты по еде уже давно говорят нам, что имеет значение, как вы его нарежете. Возможно, именно поэтому исследователи из NVIDIA и USC анонсировали дифференцируемый симулятор для роботизированной резки — или DiSECt — который будет использовать синтетические данные, чтобы помочь роботам научиться нарезать их. Но нарезка картофеля не является конечной целью. Приготовление пищи может свидетельствовать о способности системы учиться, адаптироваться и применять на практике навыки, необходимые для выполнения более значимых задач, таких как хирургия.

Исследователи создают симулятор, чтобы помочь роботам владеть ножами, через The Spoon.

#Детские шаги

Увидеть параллели между роботами и детьми несложно. Уведомление Roomba о том, что он «требует вашего внимания», потому что он «застрял у обрыва», довольно точно передает способность малыша оценивать риски. Facebook, IBM и Google уловили эту закономерность и решили использовать ее в буквальном смысле, научив робота маневрировать и ориентироваться («ходить»), как их 9–16-месячный ребенок. Исследователи используют смоделированные среды, чтобы научить робота реагировать на сложные условия и даже учиться на своих ошибках. Дети будут в порядке.

Как вы учите роботов ориентироваться в новых местах? Изучайте малышей, через The Washington Post.

#РечьИИ

Единственное, что может быть страшнее робота, который может ходить, стрелять и наносить удары, это тот, который на самом деле будет кричать на вас. Технология глубокого обучения проложила путь к быстрому развитию моделирования голоса, и несколько стартапов, таких как WellSaid Labs, Resemble.ai и Sonantic, создают ботов с убедительно эмоциональными тонами. После обучения у настоящего актера озвучивания, голоса Sonantic могут шептать, плакать, кричать и даже смеяться. Что касается тех, кто не смеется, — актеров озвучивания в SAG-AFTRA, которые боятся быть исключенными из сделки.

Актеры озвучивания с искусственным интеллектом звучат более человечно, чем когда-либо, и их готовы нанять, согласно MIT Technology Review.

#Браво

Экспериментальный мозговой имплантат только что прочитал чьи-то мысли (мы уточним), и на данный момент это отличные новости. Участнику исследования BRAVO1 около 30 лет. Пятнадцать лет назад в результате инсульта у него почти полностью парализовало руки, ноги и мышцы голосового тракта. Но не в тех участках его мозга, которые когда-то давали речевые команды. Итак, команда U.C. Сан-Франциско создал устройство с искусственным интеллектом, которое расшифровывает сигналы в его мозгу, которые ранее контролировали голосовой тракт, вместо того, чтобы требовать от него использования движений глаз или головы, которые инструктируют аналогичные продукты. В течение нескольких месяцев они имплантировали датчики на поверхность его мозга и заставили компьютер изучать закономерности электрической активности, когда он произносил 50 разных слов. BRAVO1 в настоящее время может общаться со скоростью 15 слов в минуту со словарным запасом в 50 слов.

Экспериментальный мозговой имплантат позволяет парализованному человеку превращать свои мысли в слова, через NPR.

#JeNeSaisQuoi

Исследование Nature Human Behavior говорит, что ИИ знают, какое искусство вам нравится — да, даже вам. Исследователи собрали данные более чем 1000 добровольцев, которые оценили случайно выбранные произведения искусства в нескольких стилях, основываясь на том, насколько они им понравились и какие характеристики они в них заметили. Алгоритм машинного зрения также оценивал произведение искусства, ища «низкоуровневые» паттерны, такие как цвет или размытые края, которые могли бы повлиять на суждения участников «высокого уровня». Объединенные данные позволили нейронной сети с высокой точностью предсказать, понравится ли участнику невидимую картину. Это исследование имеет положительные последствия для способности исследователей и алгоритмов понимать абстрактное человеческое мышление неэстетичными способами, хотя мы полагаем, что рекламодатели будут приветствовать его оригинальное использование.

Компьютер может предсказать, что вы предпочитаете — Ротко или Моне. Вот как., через Inverse.

____

📄 Бумага недели

Попиксельная классификация — это еще не все, что вам нужно для семантической сегментации

В настоящее время этот документ занимает первое место в тесте «Паноптическая сегментация на паноптическом уровне COCO» и представляет собой новаторскую семантическую и паноптическую сегментацию. Большинство моделей семантической сегментации используют попиксельные потери, но в этой статье утверждается (и доказывается), что потери, основанные на двоичных масках, приводят к лучшей производительности. Это объединяет задачи экземплярной и семантической сегментации, поскольку подход прогнозирования по маске уже был популярен при сегментации экземпляров. Есть одно предостережение: предлагаемая система MaskFormer использует декодер-трансформер. Так происходит ли скачок производительности из-за предсказания маски, или это снова трансформеры продвигают современное искусство?

____

Думаете, The Juice стоил того? Подпишитесь здесь, чтобы получать его еженедельно.