Растущий список областей, в которых машинное обучение применяется для диагностики на основе медицинских изображений.

За последние несколько месяцев было опубликовано несколько сообщений о результатах исследований, в которых утверждается, что глубокое обучение применялось и часто немедленно превосходит врачей в определенной области диагностики.

Изначально я начал этот пост в блоге, чтобы отслеживать их - я собираюсь опубликовать его как черновик, который я планирую регулярно обновлять.

Что пытается сделать глубокое обучение в диагностике медицинских изображений?

Прежде чем перейти к конкретным результатам, я хотел бы подчеркнуть, что подходы (пока), представленные ниже, имеют одну и ту же общую схему. Я попытался резюмировать это в следующем предложении:

Диагностика с помощью машинного обучения работает, когда состояние может быть сведено к задаче классификации по физиологическим данным в тех областях, где в настоящее время мы полагаемся на врача, который сможет визуально выявить закономерности, указывающие на наличие или тип состояния.

Чтобы разбить это на детали:

  • Классификация. Результаты представляют собой области медицинского диагноза, которые можно свести к проблеме классификации: при наличии некоторых данных диагноз можно свести к проблеме сопоставления этих данных с одним из N различных результатов. В некоторых случаях N = 2: задача состоит в том, чтобы просто определить, отображают ли данные (например, рентгеновский снимок) состояние или нет. Обратите внимание, что есть и другие проблемы (например, сегментация изображения), которые можно решить с помощью глубокого обучения, но я еще не видел, чтобы они использовались изолированно для диагностики (в отличие от к, скажем, только анализу).
  • Физиологические данные. В приведенных ниже результатах, как правило, используются данные медицинских изображений или данные с других типов датчиков. Стремительный рост результатов в этих областях в значительной степени объясняется созданием наборов данных (например, этих), которые намного больше, чем те, которые были доступны ранее. Распространенный подход к аннотированию набора данных (например, обозначение наличия опухоли на рентгеновском снимке) заключается в том, чтобы несколько клиницистов высказали свое мнение и сопоставили ответы.
  • Мы полагаемся на визуально идентифицируемые шаблоны. Альтернативой автоматизированной диагностической системе было бы поручение опытному клиницисту изучить ваши данные (возможно, обсудить их с другими экспертами), чтобы определить результат. Этот момент объясняет, почему глубокое обучение должно быть успешным в этой области: глубокое обучение автоматизирует весь процесс извлечения шаблонов и изучения взаимосвязей в такого рода неструктурированных данных. Существует множество немедицинских приложений глубокого обучения (например, распознавание лиц), к которым предъявляются аналогичные требования; из-за этого технология достаточно зрелая. Действительно, даже модели, обученные медицинским изображениям, теперь имеют открытый исходный код.

Чтобы получить отличные отзывы об этой местности, ознакомьтесь с обзорными статьями и сообщениями в блогах, которые я добавил в раздел ссылок внизу этого сообщения.

Где этот подход не должен работать?

Приведенный выше шаблон дает некоторое представление о тех областях, в которых этот подход в настоящее время не должен работать. Как и в этой статье упоминается, глубокое обучение не говорит нам, как следует лечить пациентов или насколько хорошо они будут себя чувствовать. Однако, в частности, в отношении вышеперечисленных пунктов, существуют домены, которые:

  • Нет проблем с классификацией. Если мы недостаточно хорошо понимаем болезнь, мы не сможем создать данные для обучения какого-либо алгоритма. Например, есть условия, у которых нет хорошо изученного развития, которые могут быть перечисленным в набор этапов. В этих случаях было бы очень сложно построить надежную модель, чтобы сказать нам, на какой стадии прогрессирования находится пациент, потому что мы не знаем, какими должны быть стадии.
  • Отсутствие (или наличие субъективных) данных. Если данных мало или нет, мы не можем обучать модели. Конечно, это начинает меняться - есть эксперименты по глубокому обучению, которые демонстрируют обучение на чрезвычайно малых наборах данных. Если есть данные, но они и / или закономерности в них субъективны (например, мгновенное переживание боли или стресса), тогда я полагаю, что подходы, описанные ниже, нужно будет переосмыслить.
  • Не полагайтесь на медицинские устройства. Точно так же области, в которых диагноз не может быть получен путем подключения пациента к какой-либо машине и сбора единственной выборки данных (например, требующих длительного отслеживания или диагностики путем исключения). Это может быть связано с тем, что (а) мы не разработали средства обнаружения заболевания - поэтому, как указано выше, требуются более фундаментальные исследования, или (б) мы не разработали жизнеспособные продукты для долгосрочного неинвазивного мониторинга для сбора данные, которые позволяют машинное обучение.

Список медицинских состояний

Мои критерии для добавления в этот список: (а) набор данных был опубликован, (б) опубликовано исследование, (в) компания или исследовательская группа написали о незавершенной работе, или (г) есть сообщения в блогах, которые опишите решение проблемы. Я отсортировал условия по алфавиту.

Я что-то упустил? Вы можете @ me on twitter, и я добавлю это.

Болезнь Альцгеймера

Это« хроническое нейродегенеративное заболевание, которое обычно начинается медленно и со временем ухудшается». Лондонские исследователи опубликовали статью, в которой сообщается об использовании данных из ADNI для обучения трехслойной нейронной сети с одним сверточным слоем, который может предсказать, является ли МРТ сканирование здоровым мозгом , мозг с умеренным когнитивным нарушением и мозг с болезнью Альцгеймера.

Аритмия

Это« группа состояний , при которой сердцебиение нерегулярно». Исследователи из Стэнфорда опубликовали статью, в которой сообщается, что разработанная ими сверточная нейронная сеть из 34 слоев превосходит показатели сертифицированных кардиологов в обнаружении широкого спектра сердечных аритмий по электрокардиограммам, записанным с помощью переносного монитора с одним отведением (проект страница , запись в блоге ).

Аутизм

Это« расстройство нервного развития , характеризующееся нарушением социального взаимодействия». Группа исследователей опубликовала статью, в которой сообщается, что алгоритм глубокого обучения, в первую очередь использующий информацию о поверхностных участках МРТ головного мозга в возрасте 6 и 12 месяцев, предсказал 24-месячный диагноз аутизма у детей с высоким семейным риском аутизма ( через @datarequena в твиттере).

Рак молочной железы

Это рак, который« развивается из ткани груди ». DeepMind Health опубликовал пост в блоге, в котором объявили, что объединились с Cancer Research UK для анализа и применения машинного обучения к анонимным маммограммам от 7 500 женщин.

Стоматологические полости

Это« разрушение зубов из-за кислот, производимых бактериями». Исследователи из ParallelDots опубликовали статью, в которой сообщается, что свёрточная сеть из 100+ слоев, которая выполняет двоичную классификацию рентгенограмм зубов на уровне пикселей (кариес / не кариес).

Диабетическая ретинопатия

Это« заболевание , при котором сетчатка поражается диабетом». Более двух лет назад проводился конкурс kaggle, цель которого заключалась в классификации изображений глаз по одному из 5 классов (от отсутствие диабетической ретинопатии до легкой, умеренный, тяжелый и пролиферативный). Выигравшее решение использовало комбинацию разреженных сверточных сетей и случайного леса для прогнозирования результата на основе пары изображений (левый и правый глаз).

Пятна по Граму

… Представляют собой метод окрашивания, используемый для разделения и классификации бактериальных видов на две большие группы ». Это лабораторный метод, который применяется к жидкостям организма (например, крови) при подозрении на инфекцию. Исследователи опубликовали статью (цитируется в этой статье), в которой описывается использование сверточной нейронной сети для классификации изображений микроскопа на грамположительные, грамотрицательные и фоновые (без клеток). В статье они описывают, что они не обучали CNN с нуля; Inception v3 доработали для этой задачи.

Рак легких

Это« злокачественная опухоль , характеризующаяся неконтролируемым ростом клеток в тканях легкого». Этот конкурс kaggle 2017 включал набор данных компьютерной томографии, и цель состояла в том, чтобы предсказать вероятность рака легких. Здесь были некоторые интересные проблемы, в том числе тот факт, что данные представлены в трех измерениях - описания выигрышных решений описывают некоторые интересные способы решения этой проблемы. В этом сообщении в блоге описываются некоторые ограничения этого соревнования с клинической точки зрения. По отдельности похоже, что Enlitic тоже работает над решением для скрининга рака легких.

Онихомикоз

Это« грибковая инфекция ногтя ». Как указывалось в этом твите, исследователи из Кореи опубликовали статью, в которой сообщается об использовании CNN (VGG-19, ResNet-152) для создания набора обучающих данных (например, извлечения изображений рук и ног из клинических фотографий) как а также классифицировать ногти по одному из шести классов (следующим образом: (онихомикоз, дистрофия ногтей, онихолиз, меланонихия, нормальный и другие), чтобы достичь диагностической точности онихомикоза с использованием глубокого обучения, которая была лучше, чем у большинства дерматологов, которые участвовал в этом исследовании .

Пневмония

Это« воспалительное состояние легких, поражающее в первую очередь небольшие воздушные мешочки, известные как альвеолы». Исследователи из Стэнфорда опубликовали статью, в которой сообщается, что разработанная ими свёрточная нейронная сеть из 121 слоя может обнаруживать пневмонию по рентгеновским снимкам грудной клетки на уровне, превышающем уровень практикующих радиологов (страница проекта).

Рак кожи

Вызваны развитием« аномальных клеток, которые могут вторгаться в другие части тела или распространяться на них ». Исследователи из Стэнфорда опубликовали документ, в котором сообщается о тонкой настройке Inception v3 для классификации 757 классов болезней с использованием отмеченного дерматологом набора данных из 129 450 клинических изображений, включая 3 374 дерматоскопических изображений. Результаты исследуются в различных задачах прогнозирования, и показатели точности кажутся сопоставимыми с оценками клиницистов.

… Я уверен, что этот список будет пополняться.

Ссылки и ресурсы