Чтение чайных листьев, чтобы попытаться предсказать будущее генеративного ИИ

Введение

От скромного начала в 1960-х годах с ELIZA, чат-ботом, имитирующим терапевта, до появления генеративно-состязательных сетей (GAN) в 2014 году, а теперь и мощных преобразователей и больших языковых моделей (LLM), которые используются в приложениях искусственного интеллекта, таких как ChatGPT и Microsoft Bing. , прогресс был не чем иным, как захватывающим дух​1​. Но какое будущее ждет генеративный ИИ? Давайте углубимся в преобразующую силу этих технологий и тенденции, которые будут определять их траекторию в ближайшие годы.

Раскрытие возможностей генеративного ИИ

По своей сути генеративный ИИ включает в себя алгоритмы ИИ, обрабатывающие огромные объемы данных для создания чего-то совершенно нового. Эволюция от справочных таблиц на основе правил к GAN, а теперь и к преобразователям, способным одновременно анализировать всю строку текста, привела к значительному повышению производительности и эффективности обучения. Например, эти преобразователи теперь используются в приложениях ИИ, таких как ChatGPT и Google Bard. Последствия как для производительности, так и для эффективности обучения оказались огромными.

Но использование преобразователей не ограничивается сферой обработки текста и языка. В области компьютерного зрения такие методы, как скрытая (или стабильная) диффузия, теперь позволяют получать одни из самых потрясающих изображений с высоким разрешением, помогая таким компаниям, как Stability и Midjourney, выделяться из толпы.

Генеративный ИИ в действии: преобразование отраслей и рабочих процессов

Реализация генеративного ИИ далеко не ограничивается несколькими секторами. На самом деле, он ведет революцию в различных отраслях и рабочих процессах. Рассмотрим несколько примеров:

Приложения для генеративного письма. Поскольку языковые модели становятся более функциональными, их используют для создания текста в самых разных приложениях. Например, такие приложения, как Jasper и Writer, используют ИИ, чтобы помочь копирайтерам по маркетингу и удовлетворить корпоративные сценарии использования соответственно. ИИ даже помогает с юридическим текстом: Harvey использует GPT-4 для автоматизации юридической работы на уровне младшего специалиста, а Ironclad оптимизирует контрактные процессы для штатных юридических групп.

Редактирование и генерация видео. Генеративный ИИ по своей сути является творческим, и это подпитывает инновации в творческих областях. Например, Runway создает, редактирует и применяет эффекты к видео с уровнем качества, приемлемым для команд, получивших «Оскар».

Производительность работы. Приложения с генеративным искусственным интеллектом, такие как Tome, позволяют легко создавать красивые презентации, используя только текстовые подсказки. Другая компания, Adept, создала модель действия ACT-1, которая учит тому, как люди взаимодействуют со своими компьютерами. Цель состоит в том, чтобы автоматизировать некоторые повторяющиеся задачи, которые мы выполняем на наших компьютерах, такие как поиск, нажатие и прокрутка, тем самым повышая производительность.

Определение курса на будущее: тенденции, за которыми стоит следить

По мере того, как мы смотрим в будущее, ландшафт генеративного ИИ и больших языковых моделей (LLM) быстро меняется. Вот три тенденции, на которые стоит обратить внимание:

  1. Инфраструктура искусственного интеллекта. Инфраструктурный уровень становится все более важной частью экосистемы. В настоящее время крупнейшие космические компании предлагают модели и облачные сервисы, но мы можем ожидать, что это изменится, поскольку компании, разрабатывающие приложения, узнают, как извлекать выгоду.
  2. Созревание использования LLM: использование LLM будет развиваться, поскольку некоторые компании решительно отдают предпочтение покупке моделей ИИ из облачных API, а другие так же страстно хотят создавать свои собственные. Эта тенденция может привести к распространению заказных моделей, подобных Bloomberg.

Что дальше в генеративном ИИ

Генеративный ИИ прошел увлекательный путь, начиная с первых систем, основанных на правилах, таких как чат-бот ELIZA в 1960-х, и заканчивая созданием генеративно-состязательных сетей (GAN) в 2014 году, а затем значительным скачком с введением Google Трансформеров. » в 2017 году​. Сегодня ландшафт генеративного ИИ динамичен и развивается благодаря постоянному совершенствованию моделей, приложений и инфраструктуры. Вот некоторые из ключевых тенденций, на которые стоит обратить внимание в этой захватывающей области.

Достижения в генеративных моделях и методах искусственного интеллекта

Использование преобразователей и других больших языковых моделей (LLM), таких как GPT (генеративные предварительно обученные преобразователи), изменило правила игры. Эти модели, обученные на обширных коллекциях человеческого языка, не только используются в сфере обработки естественного языка, но также нашли применение в различных областях, таких как сворачивание белков и вычислительная химия 1.

Запуск OpenAI GPT-4 и его инвестиции в такие методы, как Reinforcement Learning with Human Feedback (RLHF), представляют собой важное направление в эволюции LLM. Тем не менее, другие участники, такие как Anthropic со своим чат-ботом Claude, изучают различные подходы, такие как обучение с подкреплением с конституционным ИИ (RL-CAI), стремясь ограничить нежелательные результаты с помощью набора удобных для человека принципов.

Хотя ожидается, что трансформеры и другие LLM останутся доминирующими, в наступающем году, вероятно, будет больше компаний, создающих приложения, которые учатся извлекать выгоду. Ожидается, что использование LLM станет более зрелым, при этом некоторые компании будут отдавать предпочтение моделям ИИ из облачных API, в то время как другие предпочтут создавать свои собственные модели. Для компаний с уникальными и большими наборами данных обучение собственных моделей может дать конкурентные преимущества, как продемонстрировал индивидуальный LLM Bloomberg для обработки финансового языка.

Процветающая экосистема генеративной инфраструктуры искусственного интеллекта

Ландшафт инфраструктуры ИИ быстро развивается, и множество компаний предлагают модели и облачные сервисы. Такие компании, как Hugging Face, зарекомендовали себя в сообществе разработчиков программного обеспечения с открытым исходным кодом, выступая в качестве платформы для разработчиков, которые хотят обучать свои собственные модели или дорабатывать существующие.

Кроме того, все больше внимания уделяется «прогностической инфраструктуре» для обработки огромных объемов данных, необходимых для корпоративных приложений ИИ. Такие компании, как Databricks, разработанная специально для нужд групп обработки данных AI/ML, выделяются в этой области.

Расширяющийся диапазон приложений для генеративного ИИ

Генеративный ИИ не только революционизирует технические области, но и оказывает значительное влияние на популярную культуру и повседневные приложения. От создания изображений с высоким разрешением Midjourney и Stable Diffusion до рекордного роста числа пользователей ChatGPT — генеративный ИИ все больше становится частью нашей повседневной жизни.

Рост приложений для генеративного письма, которые используют возможности LLM по генерации текста, является еще одной быстрорастущей тенденцией. Jasper, например, использует GPT-4, чтобы помочь копирайтерам по маркетингу, а Writer со своей проприетарной моделью фокусируется на корпоративных сценариях использования. Появляются и более сложные приложения, такие как Harvey, использующее GPT-4 для юридической работы на уровне младшего специалиста, и Ironclad, автоматизирующее процессы заключения контрактов для юридических групп​1​​.

ИИ также повышает креативность на работе. Например, приложение для генеративного искусственного интеллекта Tome упрощает создание визуально привлекательных презентаций, используя только текстовые подсказки. Компания Adept разработала модель действий ACT-1, обученную на данных взаимодействия человека с компьютером, с целью автоматизации некоторых рутинных задач.

Что дальше в генеративном ИИ

Область искусственного интеллекта (ИИ) претерпела значительные изменения за последнее десятилетие и продолжает развиваться с беспрецедентной скоростью. Одним из самых заметных сдвигов стало появление генеративного ИИ, который обрабатывает огромные объемы данных для создания полностью оригинального вывода. Генеративный ИИ демонстрирует экспоненциальный рост, особенно в использовании преобразователей — типа нейронной сети — для всего, от генерации текста и изображений до сворачивания белков и вычислительной химии. По мере того, как мы углубляемся в эту захватывающую область, давайте посмотрим, что ждет генеративный ИИ в будущем.

Эволюция генеративного ИИ

Корни генеративного ИИ восходят к знаменитому чат-боту ELIZA 1960-х годов, который использовал таблицу поиска на основе правил для генерации ответов. Значительный скачок был сделан с появлением в 2014 году генеративно-состязательных сетей (GAN), которые позволили создавать правдоподобные изображения с низким разрешением. Однако GAN было сложно обучать и масштабировать.

В 2017 году революционным шагом вперед стал выпуск знаменитой статьи о трансформерах «Внимание — это все, что вам нужно», направленной на повышение производительности перевода текста. Исследователи предложили сосредоточиться на «внимании» — механизмах, которые обеспечивают контекст на основе положения слов в тексте. Это привело к разработке моделей-трансформеров, которые могли одновременно анализировать всю строку текста, повышая производительность и эффективность обучения. Эти модели, известные как модели больших языков (LLM), с тех пор используются в различных приложениях, включая ChatGPT и Google Bard.

Новые тенденции в генеративном ИИ

В сфере генеративного ИИ есть четыре критических тенденции. Эти тенденции не только формируют текущий ландшафт ИИ, но и позволяют заглянуть в будущее этой захватывающей области.

1. Инфраструктура генеративного ИИ: запуск OpenAI ChatGPT и GPT-4 привлек большое внимание. Тем не менее, другие компании, такие как Anthropic и Inflection, также производят фурор своими подходами к LLM. Что касается открытого исходного кода, Hugging Face стала популярной платформой для разработчиков, желающих обучать свои собственные модели или настраивать существующие. Более того, такие компании, как Databricks, сосредоточены на размещении огромных объемов данных, необходимых для корпоративных приложений ИИ, в формате, который упрощает все виды конвейеров данных.

2. Инфраструктура прогнозирования. Появление ИИ привело к появлению новой категории компаний, известной как «инфраструктура прогнозирования». Эти компании сосредоточены на маркировке данных, очистке и других процессах, важных для обучения моделей. Кроме того, такие платформы, как Arize и Hugging Face, упрощают развертывание моделей в масштабе, что указывает на растущую тенденцию к упрощению применения ИИ на уровне предприятия.

3. Приложения генеративного ИИ. Генеративный ИИ начал проникать в популярную культуру, а такие компании, как Midjourney и Stable Diffusion, набирают популярность в социальных сетях. ChatGPT также привлек внимание всего мира, став самым быстрым продуктом, набравшим 100 миллионов пользователей. Более того, приложения для генеративного письма превратились в быстро растущую категорию, и такие компании, как Jasper и Writer, используют ИИ для помощи в таких задачах, как маркетинговый копирайтинг и документация корпоративного уровня. В других областях мы видим, как генеративный ИИ используется для автоматизации таких задач, как создание презентаций PowerPoint и автоматизация взаимодействия пользователей с компьютерами.

4. Делаем энергию доступной. Генеративный ИИ не только меняет наше взаимодействие с технологиями, но и демократизирует доступ к передовым вычислительным возможностям. Новые приложения ИИ, такие как Tome, используют генеративный ИИ, чтобы пользователи могли создавать визуально привлекательные презентации, используя только текстовые подсказки. Кроме того, Adept разработал ACT-1, модель действий, целью которой является автоматизация некоторых задач поиска, щелчков мышью и прокрутки, которые обычно выполняют пользователи, что упрощает использование компьютеров.

Чего ожидать в будущем

Забегая вперед, стоит обратить внимание на несколько моментов в области генеративного ИИ.

Во-первых, мы, скорее всего, увидим сдвиг на уровне инфраструктуры. В настоящее время крупнейшие компании предлагают модели и облачные сервисы, но ситуация может измениться, поскольку компании, разрабатывающие приложения, научатся извлекать выгоду.

Во-вторых, произойдет созревание использования LLM. Некоторые компании будут решительно выступать за покупку моделей ИИ из облачных API, в то время как другие предпочтут создавать свои собственные. Прогнозируется, что стартапы будут переходить от API к своим собственным меньшим, более эффективным моделям по мере своего роста, особенно компании с большими и уникальными хранилищами данных, которые видят явные преимущества в обучении своих собственных моделей.

Рост и эволюция генеративного ИИ обещают впечатляющие достижения во многих областях, включая автоматизацию, обработку языков, творчество и многое другое. Продолжая использовать возможности этой технологии, мы можем с нетерпением ждать будущего, в котором ИИ не только расширяет возможности человека, но и способствует творчеству и инновациям.