Как не испортить свои первые шаги на пути к искусственному интеллекту

Практическое руководство для бизнес-лидеров, рассматривающих возможность интеграции ИИ, направленное на то, чтобы развеять ажиотаж и избежать ошибок новичков.

‍Введение: используйте ИИ, а не сражайтесь с ним‍

В середине-конце 1990-х годов, когда Интернет начал набирать обороты, многие сомневались в его значении, но теперь он стал неотъемлемой частью нашей жизни. Перенесемся вперед, к появлению социальных сетей, и была похожая волна сомнений, однако сегодня среднесуточное время, проведенное в социальных сетях в мире, составляет 2 часа 31 минуту. По мере того, как генеративный ИИ начинает оставлять свой след, история, похоже, повторяется. Внимание, спойлер: со временем мы, вероятно, увидим, что генеративный ИИ и варианты его использования станут таким же обычным явлением, как Интернет и социальные сети.

В 2023 году искусственный интеллект, особенно генеративный искусственный интеллект и LLM, изменят нашу повседневную жизнь, продукты и бизнес-операции. В Lazy мы постоянно решаем вопросы, возникающие из-за переизбытка данных, заблуждений и дезинформации. В этой статье мы стремимся помочь предпринимателям, руководителям предприятий и лидерам, которые только начинают использовать ИИ, подчеркивая важность информированных знаний для навигации и процветания. Присоединяйтесь к нам, когда мы углубимся в основы и предоставим ключевые идеи. Вооружение информацией имеет решающее значение для того, чтобы избежать ловушек и добиться успеха в эту эпоху.‍

AI, ML, LLM: в чем разница?

Подумайте об искусственном интеллекте (ИИ) как о всей нервной системе организма. В рамках этой «нервной системы» машинное обучение (МО) сродни способности мозга формировать воспоминания и учиться на основе опыта. Большие языковые модели (LLM) служат специализированными языковыми центрами в мозгу, ориентированными исключительно на понимание и генерацию текста. Точно так же, как каждая часть нервной системы имеет свою роль и ограничения, так же и искусственный интеллект, машинное обучение и магистратура в более широком контексте искусственного интеллекта имеют свою роль и ограничения.

Подобно вашему мозгу, эти системы искусственного интеллекта создают модель мира. Однако, в отличие от вашего мозга, они, как правило, достаточно хрупкие и лишены способности «обучаться на лету». Вместо того, чтобы испытывать богатые взаимодействия с миром, которые вы могли бы иметь, эти системы часто взаимодействуют исключительно с миром текста.

По своей сути LLM — это статистическая модель, предназначенная для прогнозирования того, какой текст должен быть следующим, исходя из некоторого исходного текста. Хотя это звучит просто, поскольку эти модели были обучены на огромных объемах данных, они оказались весьма мощными и гибкими.

‍

Для чего мы можем использовать LLM?

На самом высоком уровне большие языковые модели (LLM), такие как ChatGPT, можно использовать для решения задач, требующих:

Генерация текста
Поиск текста
Обобщающий текст
Агенты, выполняющие инструкции на естественном языке‍

Как это отражается на сценариях использования в бизнесе? Вот несколько распространенных случаев использования вместе с их решениями LLM.

Решения LLM для различных бизнес-задач

| Business Problem | LLM Solutions                                       |
|------------------|-----------------------------------------------------|
| Customer Support | - Automated responses to frequently asked questions.
|                  | - Chatbots that handle complex inquiries. 
| Content Creation | - Automated content generation for websites, blogs, 
|                  |   or advertisements.
|                  | - Personalized content recommendations. 
| Market Research  | - Sentiment analysis of consumer feedback.
|                  | - Extraction of insights from unstructured data. 
| Recruitment & HR | - Resume screening and shortlisting.
|                  | - Automated interview questions and evaluations. 
| Data Analysis    | - Automated Insights Generation by processing vast 
|                  |   datasets and generating summaries or insights.
|                  | - Natural Language Queries: Users can pose data-related
|                  |   questions in natural language.

‍‍

Модели предварительной подготовки и обучения: основные понятия

«Подобно тому, как ребенок проходит различные этапы обучения, модели ИИ также проходят период формирования, называемый «фазой обучения». На этом этапе модели ИИ предоставляется огромное количество данных для формирования ее «знаний». Есть два этапа. Для этого: предварительное обучение, когда модель изучает основы, такие как структура языка или распознавание образов, и обучение, где она получает специализированные знания, адаптированные к конкретным задачам. Однако, как только этот этап закончится, в отличие от людей, эти модели ИИ перестают обучаться. Их «образовательный путь» заходит в тупик, и они применяют то, чему научились, чтобы отвечать на вопросы, делать прогнозы или выполнять задачи.

‍

Могут ли модели освоить новые навыки после их создания/выпуска?

Модели не могут изучать новые вещи. Технически LLM не могут «обучаться на лету», поскольку модели представляют собой снимок того момента, в котором они обучаются. Однако при правильных подсказках модель может генерировать удивительно интуитивные и полезные ответы, создавая впечатление, что она изучает то, что вы хотите.

Представьте, что вам дана машина, которой вы можете управлять, скажем, это комбинация самолета, автомобиля и лодки. Он в 100 раз мощнее любой машины, когда-либо созданной на Земле. Вместо обычной кабины самолета шириной в несколько метров, панель управления этой машины имеет поперечник в сотни метров.‍

‍

Научившись управлять этой машиной, вы сможете совершать с ней удивительные подвиги! Но сама машина никогда не меняется, вместо этого обучение происходит благодаря вашей способности управлять ею.

Так обстоит дело с использованием LLM, когда вы учитесь «подсказывать им проектирование», чтобы они могли выполнять те задачи, которые вам нужны.‍

А как насчет тонкой настройки?

Возможно, вы слышали о тонкой настройке. И вы можете спросить себя: разве это не учит модель новым вещам? Не совсем. Точная настройка больше похожа на создание совершенно новой модели из существующей, где новая точно настроенная модель может быть лучше в некоторых вещах, чем исходная модель, но хуже в других вещах.

Продолжая аналогию со сверхмощной «все-машиной», предположим, что вы пытаетесь использовать ее, чтобы просверлить огромную дыру на дне океана. Однако даже после изучения инструкций и изучения того, как максимально эффективно управлять машиной, сверлить она не так уж и хорошо.

Вы возвращаетесь к создателям этой машины и просите их перестроить машину так, чтобы она хорошо справлялась с подводным бурением, даже если при выполнении других задач она будет жертвовать своими характеристиками. После нескольких недель разработки и выплаты разработчикам больших денег, они возвращаются к вам с вашей новенькой машиной для подводного бурения самолетов. Вуаля!

‍К сожалению, пришлось снять колеса, поэтому машина больше не функционирует как автомобиль.‍

Когда делать тонкую настройку?

Во-первых, попробуйте оперативную инженерию. Попробуйте решить вашу проблему с помощью оперативного проектирования. Существует множество различных стратегий оперативного проектирования, которые могут помочь вам максимально эффективно использовать общую модель, например, предоставление конкретных примеров для модели. Это называется «подсказка с несколькими кадрами». Вот некоторые критерии, которые могут указывать на то, что вам пора задуматься о тонкой настройке:

Только за счет оперативного проектирования невозможно получить необходимое качество.
Ваше взаимодействие с моделью происходит в узкоспециализированной области с очень специфическим словарем. Типичными примерами могут быть право и медицина.

‍

Риски и затраты на тюнинг

Точная настройка — это мощный метод, но он имеет свои затраты и риски:

Сбор высококачественных данных требует много времени и средств.
Точная настройка может потребовать специальных технических знаний.
Если все сделано неправильно, вы можете получить худшие результаты, чем в общей модели.

Поэтому, прежде чем приступить к созданию лучшей модели путем тонкой настройки, убедитесь, что она вам действительно нужна.

‍

Цены на размер футболки:

‍Быстрое проектирование: Маленький (S)‍
Точная настройка: средняя (M)‍
Предварительная подготовка: очень большой размер (XXL)‍

Соответствие GDPR

‍Наконец, самая интересная тема в Германии: GDPR!

Действующие правила ИИ («Закон об ИИ») в первую очередь нацелены на компании, занимающиеся моделями ИИ (такие как OpenAI-ChatGPT), а не на тех, кто реализует эти модели. Тем не менее, крайне важно оставаться в курсе событий, поскольку в ближайшем будущем правила могут стать более четкими и конкретными.

Должностное лицо GDPR каждой компании должно активно участвовать в процессе внедрения новых технологий, и на него ложится основная ответственность за соблюдение GDPR. Тем не менее, вот несколько важных фактов, которые следует учитывать:

Юридические аспекты. Обеспечьте законную основу для обработки персональных данных, например согласие пользователя или выполнение контракта. Проведите оценку воздействия на защиту данных, если эта функция предоставляет большие данные о рисках конфиденциальности. Имейте процессы для обработки запросов прав пользователей, таких как доступ к данным или их удаление.
Управление данными: собирайте и обрабатывайте только необходимые персональные данные. Установите политики хранения и хранения данных, сохраняя данные только до тех пор, пока это необходимо. Убедитесь, что соглашения действуют при использовании сторонних сервисов, таких как API GPT-4.
Прозрачность. Предоставляйте пользователям четкую информацию об обработке их данных, включая обновление уведомлений о конфиденциальности.
Мониторинг соответствия: проводите регулярные аудиты и проверки деятельности по обработке данных на предмет постоянного соответствия GDPR. Обеспечьте безопасность передачи данных за пределы ЕЭЗ, например стандартные договорные положения.‍
Меры безопасности. Примите меры безопасности для защиты личных данных, включая шифрование, контроль доступа и регулярное резервное копирование данных.

‍

Конфиденциальность данных

Ходят разговоры о рисках отправки данных в OpenAI, но давайте рассмотрим контекст. Это похоже на то, как если бы ваша электронная почта хранилась в Gmail или Google One. OpenAI — компания с оборотом 27 миллиардов долларов США, поэтому у них есть значительные ресурсы для обеспечения безопасности. Однако, если вы предпочитаете не отправлять данные в OpenAI, у нас есть возможность разместить модели самостоятельно. И это подводит нас к следующему пункту.

‍

Самостоятельно размещаемые модели с открытым исходным кодом по сравнению с проприетарными размещенными моделями‍

Выбор между самостоятельными моделями с открытым исходным кодом и проприетарными моделями представляет собой ряд компромиссов. Собственные размещенные модели обеспечивают простоту использования, плавные обновления и оптимизированные интерфейсы. Это вариант «подключи и работай», идеально подходящий для компаний, не имеющих глубоких технических знаний. Однако они могут предлагать ограниченную настройку и потенциально привязывать компании к текущим расходам на подписку. Напротив, автономные модели с открытым исходным кодом предлагают значительный контроль и настройку, что идеально подходит для предприятий с уникальными потребностями или тех, кто хочет избежать привязки к поставщику. Но у них есть свои проблемы: потенциально крутая кривая обучения, требования к первоначальной настройке и ответственность за управление обновлениями и обслуживанием.

‍ Цены на размер футболки:

Проприетарные размещенные модели: маленькие (S)
Автономные модели с открытым исходным кодом: очень большой размер (XL).

‍

Дополнительные заблуждения и ограничения

И последнее, но не менее важное: вот еще несколько дополнительных заблуждений и ограничений, которые нам часто задают, поэтому мы собрали их здесь.

Врожденное понимание. Некоторые считают, что студенты LLM искренне понимают контент, который они создают. На самом деле они «понимают» не так, как люди; они выявляют закономерности в данных и воспроизводят их.

LLM всегда дают правильные ответы. Некоторые пользователи могут предположить, что LLM безошибочны или всегда дают правильные ответы. Однако они могут предоставлять неверную или вводящую в заблуждение информацию, особенно если их данные обучения содержат предвзятость или неточности. Это известно как «галлюцинация». Существуют методы, позволяющие минимизировать галлюцинации, если они не подходят для вашего применения. В некоторых случаях, когда вы пытаетесь создать контент, галлюцинации могут оказаться полезными, поскольку LLM может генерировать невероятно креативные идеи!

Непредвзятые результаты. Несмотря на обширные данные обучения, LLM все же могут давать предвзятые или политически некорректные результаты. Они отражают данные, на которых они обучались, и которые могут включать в себя социальные предубеждения. Недавние исследования показали, что разные модели имеют разные политические пристрастия.

Обобщение по всем областям. Магистр права, несмотря на свою обширную базу знаний, могут не быть экспертами в супернишевых или очень свежих темах. Их знания и точность могут различаться в зависимости от области. Вот здесь-то и приходит на помощь тонкая настройка, подробнее об этом ниже.

Безграничная креативность. Хотя студенты LLM могут создавать креативный контент, их «креативность» основана на шаблонах, которые они видели в данных обучения. У них нет врожденной креативности или нового мышления, как у людей.

Иногда графический интерфейс лучше:Текст — это универсальный человеческий интерфейс, но это не всегда самый эффективный подход. Прежде чем переходить к LLM в качестве замены вашего графического пользовательского интерфейса, поработайте с UX-дизайнером, чтобы убедиться, что это лучший интерфейс для вашего конкретного приложения.

‍

Ключевые выводы и заключительные мысли

‍На этом я завершаю этот пост в блоге. Завершая это руководство, давайте резюмируем основные понятия и идеи, которые мы рассмотрели:

‍Познакомьтесь с основами. При необходимости углубитесь в то, что такое ИИ, модели, модели обучения и тонкая настройка перед выполнением. ‍
Примите изменения: погрузитесь в потенциал искусственного интеллекта с установкой на рост. Изучите различные варианты использования, проявите творческий подход и воспользуйтесь возможностями трансформации.‍
Начинайте, учитесь и развивайтесь. Примите принцип KISS: «Будь проще, глупый». Примите мышление бережливого стартапа: начните с минималистичных шагов и быстро адаптируйтесь. Хотя кривая обучения может быть сложной, это ценная часть пути. Получайте отзывы от своих пользователей, повторяйте и постоянно совершенствуйте свой продукт искусственного интеллекта.
‍Индивидуальный подход: оцените свои конкретные потребности и выберите правильную модель. От создания до тонкой настройки — принимайте решения, соответствующие вашим текущим требованиям и целям.‍
Баланс между безопасностью, доверием и инновациями: защита конфиденциальности и обеспечение соответствия GDPR не подлежат обсуждению. Закрепите доверие среди пользователей, продолжая ответственно внедрять инновации.‍
Безопасность имеет первостепенное значение. От защиты интеллектуальной собственности до безопасности данных – уделяйте приоритетное внимание защите вашего бизнеса и информации ваших пользователей.

Мы надеемся, что эта запись в блоге предоставила вам ценную информацию о мире искусственного интеллекта и LLM. Мы будем рады услышать ваше мнение и продолжить разговор!

Если у вас есть какие-либо вопросы или вам нужна помощь, свяжитесь с нами здесь.‍

Спасибо за чтение!

Лучано Радичче и Траун Лейден

Оригинально опубликовано на https://www.lazyconsulting.com.

На простом английском языке

Спасибо, что вы являетесь частью нашего сообщества! Прежде чем уйти:

Обязательно аплодируйте и следуйте за автором! 👏
Еще больше контента вы можете найти на PlainEnglish.io 🚀
Подпишитесь на нашу бесплатную еженедельную рассылку. 🗞️
Следуйте за нами в Twitter(X), LinkedIn, YouTube и Discord.