Что делать, если ChatGPT недостаточно для вас и вашего бизнеса?

Когда OpenAI представила ChatGPT в ноябре 2022 года, мир захлестнула волна ИИ в шторм. Многие комментаторы проводили параллели и называли это «iPhone моментом ИИ».

OpenAI представила следующую модель Generative Pre-trained Transformer 4 (GPT-4) в середине марта 2023 года. Я снова был в восторге от технологии и ее возможностей. Однако, когда я читал технический отчет, мое внимание привлекло другое: список авторов статьи занимает почти 3 страницы. Он включает около 85 основных авторов и во много раз больше дополнительных авторов, при этом для маркировки данных требуются неизвестные усилия.

Вам не нужны сверхъестественные способности, но достаточно здравого смысла и практического опыта в производственной сфере, чтобы понять, что такая модель не является экономически целесообразным путем для производственной компании.

Так что же можно сделать на производстве? Какие проблемы мы можем решить в промышленных условиях? Разберем это на практике. Этому посвящена четвертая статья из нашей серии о промышленном искусственном интеллекте (ИИ).

Какие проблемы может решить машинное обучение

Есть много хороших вводных и промежуточных текстов по ИИ и машинному обучению (МО). Они часто дают обзор типов проблем, которые можно решить с помощью ML. Мне нравится Тарек Хамди, который я перенял и немного адаптировал с течением времени.

Имейте в виду, что ИИ развивается с безумной скоростью. Пока вы читаете, разрабатываются новые алгоритмы и принципы вычислений. Тем не менее, мне нравится простая картинка выше, чтобы сделать основные концепции машинного обучения понятными. Итак, давайте погрузимся в некоторые из них.

Обучение без учителя сортирует ваши данные

При неконтролируемом обучении — как вы уже догадались — система учится без учителя. Данные не содержат меток, и система пытается сама найти существующие корреляции или найти интересные преобразования или представления.

Типичными категориями являются, среди прочего, кластеризация или уменьшение размерности. Алгоритмы кластеризации часто используются, например, для категоризации покупателей в интернет-магазине. При уменьшении размерности цель состоит в том, чтобы сжать данные без потери соответствующей информации. Он часто используется для задач сжатия данных или для подготовки данных для последующего контролируемого обучения. В производственной практике такие алгоритмы можно использовать для классификации поставщиков или определения ключевых параметров в сложных системах, и это только два примера.

Обучение с подкреплением оживляет ваших роботов

В обучении с подкреплением обучающая система называется агентом. Агент учится методом проб и ошибок. Суть в том, что за хорошее поведение его вознаграждают, а за плохое наказывают. Типичные примеры можно найти в обучении роботов или в играх, таких как знаменитая AlphaGo от DeepMind.

Обучение с учителем — это новая нефть в мире, управляемом данными

Наиболее распространенным случаем в машинном обучении является обучение с учителем. Система обучается на обучающих данных для конкретной задачи. Это означает, что обучающие данные должны описывать пространство решений с достаточной точностью, чтобы впоследствии система могла делать осмысленные утверждения.

Данные обучения помечены помечены. Например, если мы хотим отличить собак от кошек на изображениях, мы должны показать алгоритму ML во время обучения достаточно изображений, которые мы ранее пометили как «собака» или как «кошка». На практике это означает усилия, которые не следует недооценивать, поскольку маркировка обычно начинается вручную и со временем может быть лишь частично автоматизирована. Это потенциальный источник затрат, который вы должны иметь в виду.

При контролируемом обучении мы обычно решаем задачи из следующих двух категорий: классификация и регрессия. В классификации ввод присваивается классу, например, изображение относится либо к классу «собака», либо к классу «кошка». В задачах регрессии в простейшем случае прогнозируется значение. Например, прогнозирование покупной цены дома на основе его местоположения — типичная задача регрессионного типа.

Применительно к промышленным задачам, в задачах классификации, мы можем использовать МО, например, чтобы решить, является ли пустота в материале критической или нет. С другой стороны, прогнозирование срока службы компонента является примером проблемы регрессии. Имейте в виду, что эти промышленные примеры кажутся очень простыми, но требуют применения на практике.

Нейронные сети — это центр обучения с учителем

В контексте ML постоянно появляется один термин: нейронные сети (НС и их разновидности). Они — и связанные с ними достижения в вычислительных методах — являются ключевой технологией для современных алгоритмов машинного обучения для изучения новых представлений данных.

При обучении нейронных сетей веса отдельных узлов обучаются и настраиваются снова и снова, пока они не предсказывают функции в наборе обучающих данных настолько точно, насколько это необходимо. Это ресурсоемкие задачи, которые выполняются на так называемых графических процессорах (GPU) локально или в облаке и могут занимать часы или даже дни. Так что не стоит недооценивать затраты на обучение и необходимую инфраструктуру.

Мы также можем понять, что чем больше данных, тем лучше прогнозы в долгосрочной перспективе; хотя на самом деле он не черно-белый, как показано здесь. Обычно при подготовке данных мы идем на экономический компромисс, а не на технический. Поэтому здесь вам важно понимать, какой точности вам нужно добиться и насколько надежной должна быть система машинного обучения.

Однако все это по-прежнему не объясняет, почему нейронные сети только в последние годы стали мощным двигателем в приложениях ML — лежащие в их основе концепции уже были доступны в течение многих лет. Это три основных фактора: (i) наличие больших наборов данных, (ii) графические процессоры и массовые распараллеливания вычислений, и (iii) удобные библиотеки машинного обучения и улучшенные алгоритмы для обучения. Вуаля — готово оборудование, которое только и ждет, чтобы его задействовали для решения всевозможных производственных задач.

Понятно… что теперь?

Теперь вам решать, подходит ли промышленная задача для машинного обучения. В промышленной среде есть много данных изображений, которые поддаются обработке ML. Именно в этом заключалась идея нашего стартапа maXerial: оценивать двухмерные данные изображений и трехмерные объемные данные с помощью ИИ и, следовательно, лучше понимать материалы.

Но также идеальными отправными точками являются данные с производственных машин. Его можно использовать для обнаружения и прогнозирования закономерностей определенных функций с течением времени с использованием различных подходов машинного обучения и глубокого обучения. Это может сократить время простоя и количество отказов или снизить процент брака.

Усилия для таких промышленных задач сокращаются на порядки по сравнению с обучением такой большой языковой модели, как ChatGPT. Это входит в диапазон, который возможен с точки зрения времени и денег для производственных компаний. Вот где настоящее «золото» кроется в ваших данных: использование данных вашей собственной компании для создания нового уникального торгового предложения и получения конкурентного преимущества на вашем рынке.

Для меня это реальные перспективы промышленного ИИ!

Следите за нашей следующей статьей: Как начать как можно проще, расти с помощью технологии машинного обучения и привести проект к успеху.

Дополнительная литература

Это четвертая статья из нашей серии о промышленном искусственном интеллекте (ИИ). Другие статьи из этой серии (список обновляется при выпуске):

(1) Как внедрить ИИ в вашу производственную компанию

(2) Получить машиночитаемые данные для промышленного ИИ

(3) Создайте песочницы и дайте им поиграть

(4) Какие проблемы вы можете решить с помощью ML в своей компании?

(5) Ваш путь к успеху в промышленном ИИ: мыслите масштабно, начинайте с простого

(6) От пилота до поддерживаемого стека технологий ИИ