**Приведенные здесь мнения полностью принадлежат мне и не отражают мнения каких-либо организаций, с которыми я связан**

Эту статью я хотел написать очень, очень давно. Это такая тонкая и спекулятивная тема, что мне потребовалось больше года, чтобы набраться смелости, чтобы напечатать ее. Я думал о том, чтобы набросать несколько плотных схем, выделить пункты для каждой части, которую я хочу затронуть, попросить сверстников/коллег прочитать ее и т. д. — но в конце концов я решил, что просто проведу сеанс записи в потоке сознания и посмотрим, где мы закончим. Простите, если трудно уследить. Начнем с некоторых рабочих определений.

Что такое АГИ в этом контексте?

Я чувствую, что (по крайней мере, в общем онлайн-дискурсе) термин «AGI» принимает самые разные определения. Его часто неправильно истолковывают, чтобы обозначить какой-то сверхпродвинутый машинный интеллект сингулярного типа, который мы даже не можем понять сейчас. В этой статье мы говорим не об этом. Выделение жирным шрифтом и курсивом здесь было необходимо, потому что (на мой взгляд) такой тип ИИ прочно область научной фантастики на момент написания, и это тема, которую я действительно не хочу касаться, так как это, безусловно, вызовет некоторые опасения. Кроме того, мы также не собираемся касаться специализированных систем искусственного интеллекта в медицине (например, CNN, которые могут считывать рентгеновские снимки/КТ) — эта статья посвящена только искусственному интеллекту. Кроме того, здесь мы будем говорить только о клинической медицине — в будущем ОИИ может занять невероятно интересное место в медицинских исследованиях, но это лучше подходит для отдельной статьи.

ОИИ, о котором я хочу рассказать, сравнительно прост, и я чувствую, что менее чем через десять лет он станет частью нашей повседневной жизни. Определение ОИИ в этой статье выглядит следующим образом: мультимодальный искусственный интеллект с внутренней моделью мира, достаточно развитой для решения произвольных но разумных когнитивных задач. эм>

Я хочу быть очень ясным и точным в этом определении, так что необходимо много уточнений. Во-первых, мультимодальность в этом контексте относится к способности модели обрабатывать большую часть важной человеческой информации, например. изображения, видео, аудио, язык/текст и т. д. одновременно. Я предполагаю модульную структуру для этого типа модели (очень похожую на мозг млекопитающих!), где части модели обрабатывают необработанную сенсорную информацию. в совместное латентное пространство (или, по крайней мере, набор латентных пространств, которые очень легко проецируются друг в друга). Детали — это отступление, но я думаю, важно подчеркнуть, что есть осязаемые, реальные способы, которыми это может происходить/уже происходит (например, CLIP, Flamingo и т. д.). Далее, под внутренней моделью я подразумеваю некоторое абстрактное представление мира и его поведения, где могут иметь место абстрактные формы вычислений (вспомним очень известный и древний пример король-мужчина + женщина = королева ”).

Этому последнему пункту выделен отдельный абзац, потому что это наиболее важная и актуальная часть определения этой статьи: произвольные но разумные познавательные задачи. Давайте разберем его по прилагательным. Что здесь произвольного? Это не так глубоко — в основном задачи, которые охватывают любую область и контекст. та жемодель должна уметь делать такие вещи, как написать стихотворение о яблоках, написать скрипт Python для вычисления π или создать сонату для фортепиано с музыкальным видео и т. д. так далее. Разумная часть — это то, как мы основываемся на абстрактном ОИИ, который мы обсуждаем в этой статье, не может поступить неразумно/чрезвычайно сверхчеловеческие задачи; просить модель сгенерировать последовательность аминокислот для белка, который будет складываться в форму кролика было бы неразумно — я не имею в виду, что это не что-то будущее, узкоспециализированные вычислительные модели смогут это сделать. делать, я просто говорю, что это не соответствует рабочему определению AGI в этой статье. Хорошим способом усвоить определение разумный в этом контексте может быть: что-то, что человек потенциально может научиться делать. Важно отметить, это не означает, что модель не будет сверхчеловеческой в ​​некоторых задачах — она, конечно, может быть, но она будет сверхчеловеческой так же, как настольный калькулятор сверхчеловеческий. Это не очень высокая планка; в некотором смысле наши нынешние мультимодальные модели сверхчеловеческие. Какой человек может нарисовать что угодно, в любом стиле, всего за минуту? Наконец (это меньший, но более зыбкий момент), задачи, которые ОИИ может выполнять в этой статье, носят когнитивный характер, т.е. модель не может выполнять задачи, требующие мелкой моторики (или вообще любой моторики), потому что, на мой взгляд, это совсем другая область ИИ (хотя некоторые могут здесь не согласиться). Лучший способ концептуализировать это, вероятно, заключается в том, что ОИИ может делать все, что вы хотите, с помощью экрана компьютера.

Короче говоря, ОИИ в этом контексте представляет собой мультимодальную модель с очень хорошо развитым внутренним пониманием мира, которая может выполнять практически любую когнитивную задачу, которую человек может выполнить через экранный интерфейс компьютера. Немного. полный рот. Я действительно думаю, что всего через десять лет это станет очень значимой реальностью. Ключом (для прозрачности, я очень предвзят, учитывая свою историю) будет масштаб, самостоятельная игра/генерация данных и снова масштаб. Если мы чему-то и научились из нервной системы млекопитающих, так это тому, что значительная часть нашего, особенно человеческого интеллекта, обусловлена ​​эмерджентными свойствами нейронов в масштабе; мозг человекообразных обезьян поразительно похож по структуре/организации на человеческий, но они сильно различаются по количеству нейронов, связей и расходу энергии. Разница действительно сводится к масштабу. Более того, существует множество свидетельств того, что сложные модели поведения возникают в современных языковых моделях в масштабе, даже если модели обучаются одинаково. Я не хочу сильно углубляться, так что давайте вернемся назад.

Где AGI может вписаться в медицину

Я относительно уверен, что ОИИ такого типа вряд ли заменит врачей, хотя я думаю, что он радикально изменит повседневную жизнь врачей. Есть ряд причин для этого, по общему признанию, сильного утверждения, и вскоре мы углубимся в них более подробно. Однако перед этим позвольте мне дать описание того, как я вижу эту форму ОИИ, интегрирующуюся в клиническую медицину, с помощью небольшого тематического исследования.

Самая очевидная вещь, на мой взгляд, это «консультация с AGI». По сути, для некоторых консультаций, для которых обычно требуется специалист, вместо этого можно обратиться к AGI, что сэкономит много времени и усилий. Чтобы продемонстрировать осуществимость этой идеи, я уже создал простой чат-бот для «виртуальной консультации», используя общедоступный API OpenAI. Вот реальный разговор, который у меня был с чат-ботом:

Я: Эй, могу я задать вопрос о психолекарствах?

Компьютер: Конечно! Пожалуйста, отпроситесь.

Я: Отлично. У меня есть пациент, который недавно сообщил, что чувствует себя «депрессивным» — как лучше всего это оценить клинически?

Компьютер: существует несколько способов клинической оценки депрессии, но один из наиболее распространенных — использование шкалы депрессии. Эта шкала измеряет тяжесть симптомов и может помочь дать более объективную картину состояния пациента.

Я: Какую шкалу депрессии чаще всего используют?

Компьютер: наиболее распространенной шкалой депрессии является Шкала оценки депрессии Гамильтона.

Я: Отлично, позвольте мне провести тест и вернуться к вам.

Компьютер: Звучит хорошо!

Я: Я вернулся. Пациент набрал 17 баллов, что это значит?

Компьютер: 17 баллов по Шкале оценки депрессии Гамильтона указывает на то, что пациент испытывает умеренную степень депрессии.

Я: Интересно, а СИОЗС здесь уместны?

Компьютер: СИОЗС может быть подходящим для пациента с умеренным уровнем депрессии.

Я: Понял. Каковы лучшие СИОЗС первой линии?

Компьютер: лучшими СИОЗС первой линии являются флуоксетин, сертралин и пароксетин.

Я: Флуоксетин? Действительно? Я не знал, что это первая линия от депрессии.

Компьютер: флуоксетин часто используется в качестве терапии первой линии при депрессии, поскольку он обычно хорошо переносится и имеет низкий риск побочных эффектов.

Я: Понял. Какова дозировка флуоксетина?

Компьютер: Дозировка флуоксетина составляет 20 мг в сутки.

Я: Должен ли я начинать пациента с 20 мг в день?

Компьютер: начальная доза флуоксетина обычно составляет 20 мг в сутки.

Я: А если не получится?

Компьютер: если пациент не реагирует на начальную дозу флуоксетина, дозу можно увеличить до 40 мг в сутки.

Я: Понял. Существует ли максимальная безопасная доза?

Компьютер: Максимальная безопасная доза флуоксетина составляет 80 мг в сутки.

Я: Хорошо, спасибо!

Компьютер: Добро пожаловать!

Имейте в виду, что GPT-3 не был явно обучен давать медицинские советы, и на его нынешнем этапе проконсультироваться с GPT-3 за медицинской консультацией даже отдаленно небезопасно. Это был всего лишь пример. Пожалуйста, не применяйте ничего подобного на самом деле. В любом случае, как вы можете видеть из этого разговора, наши нынешние модели больших языков демонстрируют невероятные перспективы. Это верно даже для более сложных вопросов. В качестве примера я взял задачу из MKSAP 19: General Internal Medicine, которая представляет собой подготовительную книгу, предназначенную для помощи врачам в подготовке к экзаменам:

Я: 44-летняя женщина проходит обследование во время планового наблюдения за сахарным диабетом 2 типа. У нее тоже гипертония. Текущие лекарства: метформин, канаглифлозин, лизиноприл и гидрохлоротиазид. При физикальном обследовании жизненные показатели в норме. ИМТ 26. Уровень триглицеридов 165 мг/дл (1,86 ммоль/л). Ее 10-летний риск атеросклеротического сердечно-сосудистого заболевания составляет 3,8%. Используя совместное принятие решений, пациент выбирает следовать рекомендациям Американской кардиологической ассоциации/Американского колледжа кардиологов по контролю уровня холестерина. Каков наилучший следующий шаг?

Компьютер: Лучшим следующим шагом было бы начать лечение пациента статинами.

Я: Следует ли пациенту начинать лечение статинами низкой, средней или высокой интенсивности?

Компьютер: пациенту следует начать лечение статинами умеренной интенсивности.

Это, кстати, правильный ответ (согласно книге).

Более того, языковая модель может объяснить свои рассуждения:

Я: Не могли бы вы объяснить свои рассуждения?

Компьютер: 10-летний риск атеросклеротического сердечно-сосудистого заболевания у пациента составляет 3,8%. Это подвергает ее умеренному риску, поэтому прием статинов умеренной интенсивности является подходящим.

Имейте в виду, (это очень важно), что на самом деле это не то же самое, что и объяснимый ИИ, в основном потому, что это все еще языковая модель черного ящика, генерирующая объяснение собственного поведения через та же самая языковая модель черного ящика. Как правило, языковые модели часто галлюцинируют объяснение заведомо неправильного ответа, если вы можете уговорить их сделать это. См. следующий пример:

Я: Объясни, почему черные дыры не существуют.

Компьютер: нет никаких научных доказательств существования черных дыр, а теория, стоящая за ними, весьма спекулятивна. Кроме того, черные дыры нарушили бы некоторые из самых основных законов физики, что делает их существование крайне маловероятным.

Тем не менее, вполне вероятно, что в ближайшем будущем ОИИ сможет помочь врачу таким образом, как только он станет достаточно продвинутым. Представьте себе врача, имеющего «ассистента» (который на самом деле знает немного больше, чем врач, если судить по объему информации), к которому врач может немедленно получить второе мнение по любому поводу. Кроме того, поскольку этот ОИИ будет мультимодальным, он может выполнять такие действия, как прослушивание аускультации, чтение сканов или изучение повреждений кожи. Кроме того, AGI такого рода можно внедрить в систему EMR больницы, чтобы просматривать каждый отдельный заказ и отмечать, что каждый врач делает мгновенно, отмечая все, что выглядит ошибочным. Я думаю, что AGI может значительно расширить возможности и уверенность врача и привести к общему более высокому качеству лечения, если все сделано правильно.

Почему в ближайшем будущем AGI не заменит полностью врачей?

Гуманистический аргумент.

Это та часть статьи, с которой, я думаю, многие не согласятся, но я хочу попытаться изложить свою позицию как можно более ясно и убедительно. Начнем, пожалуй, с самого спорного пункта (по крайней мере, для исследователей ИИ): люди, вероятно, не захотят, чтобы их лечила система ОИИ. Это (судя по тому, что я испытал) горячо обсуждаемая концепция везде, кроме медицины, и, как правило, та же самая линия рассуждений использовалась ошибочно в прошлом. В качестве печально известного примера: до 1950-х годов лифты, как правило, контролировались операторами, которые сидели в лифте весь день и вручную контролировали двери, скорость, направление и т. Д., И автоматические лифты вызывали значительное сопротивление, поскольку многие им не доверяли. . Конечно, сегодня большинство из нас, вероятно, даже не знает, что лифты не были автоматизированы с самого начала — так пойдет ли AGI по тому же пути?

Я думаю, что для многих автоматов это, безусловно, так. Отличным примером этого являются беспилотные автомобили — я думаю, что однажды наступит время, когда многие не поймут, что раньше автомобили управлялись вручную. С медициной дело обстоит немного иначе, и любой, кто когда-либо болел средней или тяжелой степени, прекрасно это понимает; болезнь — это не просто физический опыт — эмоциональные потери неописуемы. Если онколог покажет вам ваши снимки, встретится с вами глазами и скажет с незаменимым человеческим выражением, что «у вас рак, но вы можете с ним бороться», — это то, что AGI вряд ли сможет заменить в ближайшем будущем. Дело не в том, что AGI не может эмулировать такой диалог или эмпатию (поверьте мне, GPT-3 обладает поразительной способностью эмулировать человеческую личность и эмоции — попробуйте сами с их API), это более так что у нас есть эта невероятно сложная психосоциальная потребность в убедительном человеческом взаимодействии в эти темные моменты. «Убедительно человечный» — это нечто большее, чем едва уловимые черты лица, речевые паттерны и связанные понятия, но вместо этого это внутреннее понимание того, что кто-то является человеком и что его эмоции подлинны и реальны.

Поначалу это звучит довольно романтизированно и даже банально, но я думаю, что на примере мы можем сделать этот аргумент более убедительным. Давайте взглянем на быстрый пример: смоделированная встреча с пациентом. Часто в процессе медицинского образования студенты отрабатывают свои навыки врача на «пациенте», который на самом деле является актером (студент знает, что пациент — актер). Эти сеансы иногда могут быть эмоциональными, особенно если актеру было приказано сделать презентацию, пораженную горем, или если задача студента состоит в том, чтобы «сообщить плохие новости». Однако независимо от того, насколько хорош актер, студент знает, что пациент — актер. Если вы говорите кому-то, что у него неизлечимая болезнь, опыт будет неописуемо другим, если вы знаете, что ситуация ненастоящая, независимо от того, насколько убедительна встреча. Поменяв роли, маловероятно (в ближайшем будущем), что мы как общество перейдем к состоянию, когда мы искренне верим,подсознательно AGI заботится о нас. Сама идея поднимает серьезные философские вопросы, которые слишком глубоки, чтобы даже касаться их здесь. Я относительно уверен, что для того, чтобы AGI полностью заменил врачей, нам нужно, чтобы произошло несколько важных вещей:

  • AGI должен иметь возможность убедительно эмулировать человеческие эмоции в знакомом и уникальном для человека формате (например, голос).
  • Поколение людей должно вырасти вместе с этим типом ОИИ до такой степени, что это станет чем-то само собой разумеющимся в их жизни.
  • Общий общественный сдвиг в философии, когда мы сильно усваиваем идею о том, что ОИИ может взаимодействовать с нами на человеческом уровне.

Это, на мой взгляд, вряд ли произойдет в течение длительного времени. Возможно, если выразиться более привлекательно, ОИИ вряд ли заменит врачей в ближайшем будущем не из-за неспособности сделать это, а скорее из-за нашей собственной психологии.

Моторный аргумент

Это гораздо более простой аргумент. Почти все медицинские специальности требуют определенной степени мелкой моторики. Это то, что мы действительно должны гарантировать при поступлении в медицинскую школу — мы должны подписать форму, в которой говорится, что мы способны к двигательным навыкам, необходимым для работы врачом. Как правило, даже самые простые задачи, такие как медицинский осмотр, аускультация и т. д., требуют уровня контроля, восприятия и обратной связи, намного превышающего тот, на который способна современная робототехника/ИИ. Это также тип контроля, который такие вещи, как поведенческое клонирование и обучение с подкреплением, вряд ли смогут воспроизвести без чрезвычайно значительных достижений в этой области. Насколько мне известно (и, по моему мнению), в области искусственного интеллекта и робототехники не было значительных достижений, подобных тому, что было сделано с мультимодальными моделями — в этой области требуется своего рода прорыв.

Хирургия, особенно, совершенно исключена в настоящее время. Если вам нужна моя личная интуиция, мы находимся как минимум в полувеке от полноценной хирургической автоматизации. Были изящные прототипы, такие как робот в Университете Джона Хопкинса, который может выполнить анастомоз на тонкой кишке. Выполнение сильно преувеличено — та часть анастомоза, которую наложил робот, была, пожалуй, самой простой частью процедуры, а сложная работа была выполнена опытными людьми, которые также располагали ткань наиболее идеализированным способом, чтобы позволить роботу выполнить последний анастомоз. Хуже того, вся процедура была жестко закодирована без реального обучения. Это не значит, что это не чрезвычайно значимое развитие хирургической робототехники — автоматизация частей хирургии невероятно полезна, и, возможно, этой теме можно посвятить отдельную статью. Однако в духе статьи это не означает достижений в области ИИ и не относится к идее о замене медицины ИИ.

Политический аргумент

Это мой наименее любимый аргумент, потому что он скучный и не имеет ничего общего с реальной наукой. Тем не менее, это, вероятно, одна из наиболее важных текущих причин, по которым мы не увидим, как AGI заменит врачей.

Такневероятно сложно что-то изменить в здравоохранении. Для краткого сравнения: смехотворно сложно убедить DMV позволить какой-либо автоматизации транспортных средств выйти на улицы, но здравоохранение, возможно, регулируется на несколько порядков более строго. Это не та часть нашего общества, которую можно «разрушить». Кроме того, проблема заключается в том, что наши нынешние модели ИИ (которые, на мой взгляд, являются сильными претендентами на ОИИ при правильном масштабировании) представляют собой «черный ящик». Опять же, я не говорю, что это на самом деле проблема с технологиями (лично я не думаю, что это огромная проблема; люди во многих отношениях — черные ящики…), но это определенно будет проблемой в отношении политики. . Как вы объясните регулирующему органу, что что-то просто «работает» или что способность давать разумные медицинские советы является неким «эмерджентным свойством больших языковых моделей»? Я не ожидаю, что регуляторы точно купятся на этот аргумент.

Кроме того, весьма вероятно, что определенные организации (которые останутся неназванными, чтобы сохранить мою будущую карьеру) будут судиться и лоббировать на краю земли, чтобы предотвратить исчезновение рабочих мест и зарплат врачей. Я не говорю, что это справедливо, но это реальность, с которой мы столкнемся, пытаясь внедрить ОИИ в медицину. Политика даже отдаленно не является моей компетенцией, и я действительно не хочу навлекать на себя слишком много неприятностей, поэтому я не буду говорить об этом дальше.

Что может сделать ИИИ для медицины в ближайшем будущем?

Я определенно мог видеть, как AGI значительно расширяет спектр услуг существующих поставщиков медицинских услуг. Например, первичная медико-санитарная помощь или рутинные амбулаторные визиты, возможно, могут полностью осуществляться поставщиками с меньшей подготовкой, чем нынешние врачи. Например, практикующие медсестры и помощники врачей, возможно, могли бы полностью заниматься амбулаторной первичной медико-санитарной помощью и расширить свой собственный объем помощи, с «врачом AGI», который подписывает приказы и записи, выявляет медицинские ошибки, предлагает курсы лечения и оценивает. когда пациент может нуждаться в более специализированной помощи. Если сделать еще один шаг вперед, то может оказаться, что ОИИ настолько развит, что единственный необходимый человек — это обученный техник, который будет действовать как «тело» ОИИ, выполняя физический осмотр и любую другую задачу, требующую мелкой моторики. Конечно, многие из вышеперечисленных проблем все еще присутствуют здесь, но я не вижу их полностью исключенными в далеком будущем. Однако распространение этой помощи на стационарные условия, вероятно, будет намного сложнее. Кроме того, AGI может автоматизировать большую часть работы по сортировке и обрабатывать простые случаи в отделении неотложной помощи, потенциально сокращая время ожидания и затраты. Вот несколько быстрых примеров диалогов с GPT-3:

Я: У меня болит спина
Компьютер: Какова природа боли в спине? Она острая, тупая или ноющая?
Я: Ноющая
Компьютер: Боль постоянная или она приходит и уходит?
Я: Она постоянная
Компьютер: Является ли боль усиливается при движении или остается прежней?
Я: Хуже
Компьютер: Мне жаль это слышать. Пожалуйста, дождитесь приема врача.

GPT-3 правильно оценивает общую боль в спине как неотложную.

Я: У меня болит спина
Компьютер: Какова природа боли в спине? Она острая, тупая или пульсирующая?
Я: Тупая
Компьютер: У вас есть другие симптомы?
Я: Я не могу контролировать свой мочевой пузырь, это очень смущает
Компьютер: Вам следует немедленно обратиться к врачу.

GPT-3 правильно оценивает, что боль в спине в сочетании с недержанием мочи является эмерджентной.

Учитывая невероятное мастерство GPT-3 в естественном разговоре, будущий AGI также может сыграть большую роль в обучении пациентов. Я представляю персонализированный AGI, который имеет доступ к медицинской информации пациента и плану лечения, который может ответить на основные вопросы, которые возникают у пациента, когда врач недоступен (поздно ночью, в выходные и т. сказать «это может подождать до понедельника для вашего врача» или «это срочно, пожалуйста, обратитесь в отделение неотложной помощи как можно скорее») и в целом расширить доступ к медицинскому образованию. Это сильно отличается от доступа к Интернету — использование Google для того, чтобы задать вопрос, настолько отличается от личного разговора с экспертом, и одно из следствий ОИИ, которое я ожидаю увидеть взрыв в доступе к образованию и самодидактические способности обычного человека. Я не могу себе представить, насколько проще было бы изучать программирование и машинное обучение, если бы у меня был AGI, с которым можно было постоянно разговаривать и задавать вопросы. Google и StackOverflow были потрясающими, но это не то же самое, что иметь эксперта, с которым можно общаться 24/7. Мы немного отклонились от темы, но я думаю, что мы в любом случае находимся в хорошей точке подведения итогов.

Я многого не упомянул в этой статье, но я надеюсь, что дискуссия вокруг этой статьи охватит большую часть этого и вдохновит на новые идеи и направления, чтобы использовать не только будущий ОИИ, но и невероятные инструменты, которые у нас есть в настоящее время.