На прошлой неделе я посетил еще один хакатон — MedTech SuperConnector Challenge. Темой выходных было психическое здоровье, и по совпадению это произошло в конце моей 6-недельной психиатрической привязанности. Вместо того, чтобы говорить о нашей идее, которая, как мне кажется, недостаточно развита для поста, я хотел написать о некоторых фундаментальных трудностях применения подхода, основанного на данных, для психиатрических состояний. Я дам краткое введение в то, как такие состояния определяются клинически, обсужу современные подходы и закончу своим мнением о том, как нам следует подходить к этой области.

Клиническая классификация

Клиницисты используют два основных руководства по классификации психических расстройств: МКБ-10 (11-я редакция, выпущенная в 2018 г.), одобренная Всемирной организацией здравоохранения, и DSM-IV, одобренная Американской психиатрической ассоциацией. Для целей этого поста я буду использовать Руководство по МКБ-10.

МКБ-10 группирует психические расстройства в следующие большие категории:

  • Органические расстройства — в основном деменция
  • Злоупотребление алкоголем или наркотиками
  • Шизофрения и бредовые расстройства
  • Расстройства настроения
  • Невротические и связанные со стрессом расстройства
  • Поведенческие, личностные, нарушения развития

Я перефразировал и объединил последние несколько категорий для неклинических читателей. Из них я буду обсуждать расстройства настроения, поскольку в настоящее время они кажутся одной из самых популярных тем для приложений машинного обучения.

Расстройства настроения — депрессия

В эту категорию также входят состояния, связанные с манией. Однако из-за его относительной частоты самые последние работы были сосредоточены на депрессии. Вот как описывается депрессия:

При типичных депрессивных эпизодах всех трех разновидностей, описанных ниже (легкая, умеренная и тяжелая), человек обычно страдает от подавленного настроения, потери интереса и удовольствия, снижения энергии, что приводит к повышенной утомляемости и снижению активности. Заметная усталость даже после незначительного усилия является обычным явлением. [F32 Депрессивный эпизод, МКБ-10]

В клинической практике мы часто используем опросник PHQ-9, который был разработан компанией Pfizer на основе приведенного выше описания (они ссылались на рекомендации АРА, но здесь это не имеет значения). Анкета начинается со следующего вопроса: «Как часто за последние две недели Вас беспокоила какая-либо из следующих проблем?». Далее следуют девять проблем: «Мало интереса или удовольствия от занятий?», «Чувство подавленности, депрессии или безнадежности?» и т. д. Пациентов просят ответить на приведенные выше вопросы одним из четырех вариантов (вовсе нет, некоторые дни, большинство дней, все дни), что преобразуется в баллы от 0 до 3 соответственно.

Каким бы субъективным ни казался приведенный выше метод, проверочное исследование опроса PHQ-9 показало, что оценка >= 10 имеет 88% специфичность и 88% чувствительность для большой депрессии. Все идет нормально. Однако в самой статье говорится, что положительный прогностический балл для порогов легкой и средней степени тяжести значительно падает до 31%. Кроме того, в исходном исследовании не учитывалось, насколько чувствительны баллы к изменению состояния пациента. Два исследования [1, 2], которые, как я обнаружил, пытались сделать это, оба пришли к выводу, что для оценки гипотезы требуется лучшее испытание. Учитывая присущую субъективность не только анкеты, но и определения депрессивного расстройства, любой количественный анализ, вероятно, будет иметь огромную неопределенность.

Неопределенность — почему это важно?

Нам необходимо понять характер неопределенности в этой ситуации. В Кандидатской диссертации Ярина Галя он объясняет возможные источники неопределенности в машинном обучении следующим образом:

  • зашумленные данные (наши наблюдаемые метки могут быть зашумлены, например, в результате неточности измерения, что приводит к алеаторической неопределенности)
  • неопределенность в параметрах модели, которые лучше всего объясняют наблюдаемые данные (большое количество возможных моделей могут объяснить данный набор данных, и в этом случае мы можем быть не уверены, какие параметры модели выбрать для прогнозирования)
  • структурная неопределенность (какую структуру модели мы должны использовать? как нам указать нашу модель для хорошей экстраполяции/интерполяции?).

Они были написаны в контексте машинного обучения, однако они тесно связаны с нашим обсуждением, если вы рассматриваете PHQ-9 как первый уровень модели нейронной сети, которая извлекает определенный набор функций. Сказанное выше можно перефразировать.

  • зашумленные данные (тяжесть депрессии очень субъективна и легко зависит от факторов окружающей среды)
  • параметры модели (какие из вопросов опроса PHQ-9 наиболее предсказуемы?)
  • структурная неопределенность (достаточно ли глубока и широка съемка PHQ-9?)

Понимание источника неопределенности имеет значение, поскольку оно изменит то, как мы на них реагируем.

Что мы делаем?

Существует несколько подходов к тому, что мы можем сделать для устранения каждой неопределенности. Первый источник, который по своей сути обусловлен отсутствием количественного определения депрессии, может быть рассмотрен с использованием подхода вероятностного моделирования в некоторой степени. По сути, нам нужно будет собрать больше информации от субъекта о пространственно-временной среде, чтобы исключить посторонние воздействия. Возможно, стоит попробовать рассмотреть подход исследователей каузального вывода.

Два других источника неопределенности связаны с опросом PHQ-9 — созданной вручную моделью извлечения признаков. Развитие глубоких нейронных сетей сделало такие попытки устаревшими во многих областях, и я считаю, что депрессия не является исключением. Нам нужно просмотреть необработанные данные, которые в данном случае представляют собой аудиозапись консультации, на которой клиницист оценивает описательные критерии депрессии. Хотя есть работы, пытающиеся предсказать депрессию по вокальной просодии, многие из них ограничены тем фактом, что их ярлыки основаны на баллах PHQ-9 (или эквивалентных опросах), что является тем самым источником неопределенности, к которому мы хотим обратиться. Попытки предсказать депрессию по выражению лица также интересны, но проблематичны с точки зрения неопределенности. Насколько я согласен с потенциальной пользой этого, мы должны быть осторожны, поскольку выражение лица может быть «ассоциировано» с депрессией, но может не иметь прямой причинно-следственной связи с клиническим определением депрессии.