Медицина оказывается завалена данными. От электронных медицинских карт до носимых устройств сбор, хранение и синтез данных становятся важной частью медицинского мира. Глубокое обучение использует компьютерное моделирование, известное как искусственные нейронные сети, для выявления сложных взаимосвязей в больших наборах данных и перспективного применения этих знаний к вновь добавленным данным. Статья Лу и др. «Глубокое обучение для оценки долгосрочной смертности по рентгенограммам грудной клетки» представляет собой интересное введение в использование глубокого обучения в медицине.

Авторы создали сверточную нейронную сеть, названную CXR-риск, для прогнозирования долгосрочной смертности от всех причин на основании результатов рентгенографии грудной клетки. Тестирование этой модели проводилось с использованием скрининговых рентгенограмм из исследования по скринингу рака предстательной железы, легких, колоректального рака и рака яичников с последующим внешним тестированием с помощью скринингового рентгенографического отделения Национального исследования по скринингу легких. Они обучили систему искусственного интеллекта (ИИ) с помощью 85 000 рентгеновских снимков и данных наблюдения более 40 000 человек. Извлекая информацию из отдельных рентгенограмм грудной клетки, система обнаружила градуированную связь между оценкой риска и смертностью.

Наборы данных для разработки и тестирования CNN

CXR-риск CNN был разработан в 80% (41 856 из 52 320) случайной выборки участников PLCO с исходной рентгенограммой грудной клетки. Участники набора данных для разработки были далее случайным образом разделены на обучение модели (33 485 из 41 856 [80 %]) и настройку (8 371 [20 %]). Исходные рентгенограммы и рентгенограммы грудной клетки каждого участника набора данных для разработки обрабатывались независимо (n = 85 748), при этом у некоторых участников было более 1 исходной рентгенограммы или рентгенограммы грудной клетки T1. Окончательная модель была протестирована на оставшихся 20% (10 464 из 52 320) участников PLCO, выделенных во время разработки модели как независимый набор тестовых данных (тест PLCO). Модель была дополнительно протестирована на 5493 участниках NLST (тест NLST). Оба набора тестовых данных включали одну базовую рентгенограмму грудной клетки на каждого участника, чтобы отразить предполагаемый вариант использования.

Развитие CNN

Они использовали подход трансферного обучения с модифицированной архитектурой Inception-v4. CNN был разработан с использованием только рентгенограмм грудной клетки и поэтапного классификатора; никакая другая информация, включая возраст, пол, факторы риска, данные рентгенограммы грудной клетки, продолжительность наблюдения или цензура, не была доступна CNN. Градиентно-взвешенные карты активации класса (Grad-CAM) были созданы для локализации анатомии, которая способствовала прогнозам.

Авторы смогли выявить пациентов с повышенным риском смертности в возрасте 6 и 12 лет, используя диагностические данные и стандартные факторы риска. Это исследование расширяет возможности глубокого обучения от моделей, которые надежно предсказывают краткосрочные результаты, до моделей, которые могут надежно предсказывать результаты в отдаленном будущем. Исследователи разделили людей на квинтили по шкале риска CXR. Для лиц с очень высоким риском рентгенологического исследования уровень смертности составил 53,0% (250 смертей среди 472 человек) при 12,2-летнем наблюдении в исследовании скрининга рака предстательной железы, легких, толстой кишки и яичников (PLCO); это было 33,9% (61/180) через 6,3 года в Национальном испытании скрининга легких (NLST).

Результаты

Данные были проанализированы для смертности от всех причин, первичной конечной точки и смертности от конкретных причин с января 2018 года по май 2019 года.

После поправки на данные рентгенологов и другие факторы риска, включая возраст, пол и сопутствующие заболевания, у участников PLCO в самом высоком квинтиле по баллу CXR риск смерти был почти в пять раз выше, чем у участников в самом низком квинтиле (скорректированное отношение рисков [aHR] , 4,8; 95% ДИ, 3,6–6,4, P ≤ 0,001). Риск был в семь раз выше для участников NLST (aHR, 7,0; 95% ДИ, 4,0–12,1, P ≤ 0,001).

Авторы отмечают, что показатель CXR также в значительной степени связан со смертностью от конкретных причин в обеих испытуемых популяциях. В частности, для смерти от рака легкого aHR составлял 11,1 для квинтиля с наивысшим баллом по сравнению с квинтилем с самым низким показателем в PLCO и 8,4 в квинтиле NLST. Для смерти от сердечно-сосудистых заболеваний aHR составил 3,6 и 47,8 в PLCO и NLST соответственно. Для смертей от респираторных заболеваний aHR составлял 27,5 и 31,9.

Это исследование подчеркивает одно из преимуществ глубокого обучения; перспектива выявления пациентов с риском неблагоприятных исходов, а затем попытка избежать этого неблагоприятного исхода. Авторы предположили, что он идентифицировал закономерности на рентгенограмме грудной клетки, не связанные с отдельным диагнозом или заболеванием, а как суммарную меру основного прогноза и состояния здоровья. Но на данный момент клиницисты могут действительно лечить этих пациентов, только управляя их факторами риска. Кроме того, нет рекомендаций по окончательному лечению, которое продлит жизнь этим пациентам. Другой вопрос заключается в том, хотели бы пациенты знать свою вероятность жизни через 12 лет, если бы они изначально были бессимптомными? Следует также учитывать возможность непреднамеренного вреда, включая ненужное тестирование, отказ в лечении, отказ в страховании, ухудшение состояния здоровья и тревогу.