Обнаружение аномалии на поверхности Марса - поиск иголок в стоге сена!

Преодоление проблем с данными и использование глубоких сверточных сетей и сотрудничества с сообществом для обнаружения аномалий на Марсе.

У меня появилась прекрасная возможность поработать над вызовом Omdena AI Обнаружение аномалий на поверхности Марса. Целью этого проекта является обнаружение аномалий на поверхности Марса (MARS), вызванных инопланетными артефактами, такими как дерби из посадочных модулей MARS, марсоходы и т. Д.

В прошлом я пытался участвовать в нескольких соревнованиях по «Kaggle» и «AnalyticsVidya», хотя это помогло мне улучшить мое понимание области искусственного интеллекта, я чувствовал, что возможности обучения ограничены из-за контекста конкуренции. Когда я наткнулся на «Омдена», их слоган «учиться через сотрудничество» сразу заинтересовал меня. Я считаю, что лучше всего учиться, когда мы работаем вместе, как команда, преследующая общую цель. То, что я узнал за последние пару месяцев в этом испытании ИИ, намного больше, чем то, что я узнал из всех соревнований вместе взятых.

В последнее время поиск так называемых «техносигнатур» - измеримых свойств или эффектов, которые предоставляют научные доказательства прошлых или настоящих внеземных технологий, вызвал новый интерес. НАСА провело семинар «Техносигнатуры» в Лунно-планетарном институте в Хьюстоне, штат Техас, в сентябре 2018 года, чтобы узнать больше о текущей области и состоянии поиска «Техносигнатуры» и о том, какую роль может сыграть НАСА. в этих поисках в будущем. Одно из направлений в этой области исследований - поиск артефактов неземного происхождения в Солнечной системе. Задача искусственного интеллекта направлена ​​на разработку «набора инструментов искусственного интеллекта» для ученых-планетологов, который поможет идентифицировать инопланетные артефакты.

У этой задачи AI было несколько проблем, начиная с набора данных.

Проблемы в наборе данных

Обнаружение аномалий на марсианской поверхности вызвало несколько уникальных проблем. Помимо проблем со сбором данных и отсутствием заранее определенного набора данных, первоначальная проблема заключается в том, что поверхность Марса сама по себе очень разнообразна. Другая часть марсианской поверхности выглядит совершенно иначе, чем остальные. Одна и та же поверхность в разное время года выглядит очень по-разному. Немногочисленные образцы разнообразной марсианской поверхности:

Итак, алгоритм должен быть достаточно общим, чтобы обнаруживать аномалии на всех этих разнообразных поверхностях. Вторая проблема связана с дисбалансом данных, поверхность Марса составляет около 145 миллионов квадратных километров, и на этой поверхности у нас есть несколько сотен аномалий, каждая размером не более нескольких десятков футов. Можно было бы рассмотреть возможность использования увеличения данных для преодоления дисбаланса, но тем не менее аномалии, которые создаются в разных ландшафтах, будут разными, и у нас нет размеченных данных для разных ландшафтов.

Следующая проблема заключается в том, что совокупность данных уже загрязнена аномалиями. Обычные алгоритмы обнаружения аномалий работают путем обучения модели ИИ на нормальных / обычных выборках населения, и модель используется для прогнозирования того, насколько целевые данные отклоняются от нормальной / обычной выборки населения. Здесь нельзя применить такой подход.

Создание набора данных

Набор данных, который я использовал для этого упражнения, - это образы оборудования MSL через 12 дней после приземления, https://www.uahirise.org/ESP_028401_1755. На этом изображении люди из Университета Аризоны прокомментировали изображения поверхности, на которых оборудование создавало аномалии на поверхности Марса. Кажется, это идеальный набор данных для первоначальной оценки.

Само полное изображение HiRISE имеет размер около 550 МБ и разрешение 25516x45788 пикселей. Слева находится сжатое изображение для просмотра полного изображения HiRISE. На этом изображении аномалии практически не видны. Даже на изображении с полным разрешением очень трудно обнаружить аномалии, если не знаешь точно, где искать.

Чтобы создать набор данных из этого изображения, я разделил это изображение размером 25516x45788 пикселей на небольшие фрагменты изображений размером 256x256 пикселей с шагом 256 пикселей. Как вы можете видеть, это изображение имеет черные границы вокруг, а черные границы не подходят для моделей AI. Чтобы уменьшить усилия по предварительной обработке этого изображения, я удалил фрагменты изображений на границах и использовал фрагменты изображений из центра изображений. В результате получается набор данных, содержащий около 10К изображений. На этих 10К изображениях есть 6 аномалий, распределенных по 50 изображениям.

Ниже приведены образцы изображений 6 аномалий, присутствующих в наборе данных:

Интуиция, лежащая в основе алгоритма

Основная мотивация - воспользоваться преимуществами набора данных и применить подход Обнаружение аномалий с использованием завершения изображений на основе глубокого обучения, как указано в публикации https://arxiv.org/abs/1811.06861

Идея состоит в том, чтобы использовать глубокую сверточную нейронную сеть для поэтапного завершения изображений поверхности с целью обнаружения аномалий на поверхности. Подход, используемый в статье, состоит в том, чтобы обучить модель исключительно на нормальных данных, замаскировать / вырезать центр 32x32 пикселя, и модель обучается для восстановления замаскированной области. Для обнаружения аномалий центр изображения запроса 32x32 пикселя замаскирован, и модель используется для восстановления безошибочных клонов замаскированной области. Путем вычитания соответствующей области запроса из сгенерированной области получается пиксельная оценка аномалий, которая затем используется для обнаружения аномалий.

В нашем наборе данных, поскольку ожидается, что аномалии будут намного меньше по сравнению с обычными изображениями, мы будем использовать весь набор данных как есть для обучения модели. Затем обученная модель используется для вычисления оценки аномалии на том же наборе данных. Поскольку модель будет обобщать нормальные изображения, ожидается, что она выдаст высокие оценки аномалий для аномалий.

Давайте проверим, сможет ли этот подход найти эти 6 иголок в стоге сена из 10К изображений.

Генеративная DCNN с прямой связью

Задачи завершения изображения обычно имеют целью заполнить недостающие области изображения наиболее естественным образом. Помимо семантического смысла, рисунок должен также выглядеть как можно более аутентичным. По этой причине DCNN с прямой связью часто обучаются совместно с враждебной сетью. Состязательная сеть имеет целью различать поддельные и настоящие изображения. Напротив, генеративная модель должна увеличивать количество ошибок в состязательной сети за счет создания реалистичных изображений. Хотя эта дополнительная состязательная потеря действительно заставляет изображения выглядеть более реалистично, она не оказывает положительного влияния на пиксельное сопоставление отсутствующей части изображения. Обучение с помощью функции совместных потерь даже увеличивает ошибку пиксельной реконструкции, что является нежелательным поведением для обнаружения аномалий. По этой причине в статье используется генеративная DCNN с прямой связью, обучающаяся только с потерей реконструкции.

Определение модели

Сеть DCNN состоит из 17 уровней, как показано на рисунке выше. После третьего слоя разрешение функциональных карт уменьшается вдвое за счет строгой свертки. Для увеличения рецептивных полей выходных нейронов используется серия расширенных сверток (слои 7-10). Повышение масштаба до входного размера на уровне 13 выполняется билинейным масштабированием с последующей сверткой. Зеркальное заполнение используется для всех сверточных слоев. Кроме того, используются функции активации экспоненциальной линейной единицы (ELU).

Функция потерь

Сеть обучается с потерей восстановления L1. Центральная область 32x32, определяемая двоичной маской M, взвешивается иначе, чем остальная область. Поскольку X является патчем изображения, который необходимо проверить, сеть обучается со следующей функцией потерь:

Обучение

Размер фрагментов изображения 256x256 изменяется до 128x128, а в сеть завершения изображения загружаются фрагменты изображения размером 128x128. Патчи испорчены за счет маскировки центральной области размером 32 x32. Это большое соотношение между известным и неизвестным содержанием изображения предоставляет сети больше семантической информации для завершения центральной области. После восстановления поврежденного изображения сетью абсолютная пиксельная разница между восстановленным изображением и изображением по запросу вычисляется как значение потерь с помощью вышеупомянутой функции потерь. Модель обучена на 200 эпох.

Оценка аномалий

Для обнаружения аномалии используется только центральная область 24x24 этого изображения с абсолютной разницей. На участках изображения, в которых дефекты появляются близко к границе вырезанной центральной области 32 x32, нейронная сеть, кажется, генерирует локальные продолжения граничащих дефектов. Рассматривая только центральную область 24x24, эти нежелательные продолжения в основном исключаются.

Первоначальные результаты

После обучения модели для 200 эпох этот режим снова используется для прогнозирования оценки аномалии на том же наборе данных. Полученное распределение оценок аномалий выглядит следующим образом:

Перечисление изображений, которые находятся на 3 стандартных отклонения от среднего значения образца, дает нам 99 файлов изображений. 99 изображений из 10К неплохие. Сравнивая эти имена файлов с фрагментами аномальных изображений из 99 изображений, эта модель обнаружила только две категории аномалий, «Парашют» и «Спуск-Стадия-Место аварии». Он пропустил «Heat-Sheild», «2-new-spot-spot1», «2-new-spot-spot2», «Curiosity-Rover». Из 99 изображений только 7 изображений имели аномалии. Но не очень хороший результат!

Импровизация

При тщательном анализе изображений аномалий, которые не были обнаружены, было обнаружено, что пропущенные изображения аномалий имеют аномалии сбоку от изображения, то есть не в центре изображения 32x32. Поскольку модель DCNN обучена восстанавливать центральные 32x32 пикселя, разделение фрагментов изображения с шагом 16 гарантирует, что аномалия будет занимать центральную часть 32x32 некоторых фрагментов изображения.

Итак, воссоздан исходный набор данных с фрагментами изображения, нарезанными с шагом 16. Вместо повторного обучения модели на этом новом наборе данных, ранее обученная модель используется для прогнозирования оценки аномалии на этом наборе данных с шагом 16. В результате распределение баллов аномалий выглядит так:

Мы ясно видим всплеск количества изображений в крайнем правом углу распределений. Перечисление изображений, которые находятся на 3 стандартных отклонения от выборочного среднего, дает нам 705 файлов изображений. Ссылаясь на эти имена файлов с фрагментами изображений аномалий, было обнаружено, что все 705 файлов принадлежат к четырем типам аномалий: «Тепловая защита», «Парашют», «Место спуска-Этап-Авария», «Кьюриосити-Ровер». '. И ноль ложных срабатываний. Вуаля, из шести игл найдено 4!

При таком подходе по-прежнему не учитывались аномалии «2-новые-точки-точки2» и «2-новые-точки-точки1». Если мы наблюдаем эти аномалии, эти аномалии очень малы, и поскольку изображения масштабируются с 256x256 до 128x128, оценки аномалий, генерируемые этими изображениями, будут меньше.

Заключение

Подход «Обнаружение аномалий с использованием завершения изображения на основе глубокого обучения» кажется жизнеспособным вариантом для обнаружения техно-сигнатур на поверхности Марса. Характеристики модели могут быть дополнительно улучшены за счет:

  • Тренируйтесь для большего количества эпох
  • Конфигурация модели апскейлинга
  • Кластеризация изображений HiRISE и обучение на группе похожих изображений, чтобы модель лучше обобщала и более решительно обнаруживала аномалии.

Если вы хотите принять участие в одном из наших челленджей, подайте заявку здесь.

Если вы хотите получать новости о наших вызовах искусственного интеллекта, получать интервью с экспертами и практические советы по развитию своих навыков искусственного интеллекта, подпишитесь на нашу ежемесячную новостную рассылку.

Мы также находимся в LinkedIn, Instagram, Facebook и Twitter.