Полный цикл проекта машинного обучения (все необходимые шаги)

Работая над проектом машинного обучения или завершая его, вы, возможно, не знали обо всех необходимых шагах для создания успешного проекта. Давайте обсудим шаги, о которых вам обычно следует подумать, прежде чем мы перейдем к конкретным шагам, о которых вам следует подумать.

Все люди уникальны, поэтому шаги, описанные в этом блоге, могут хорошо сработать для некоторых людей, но могут не сработать для вас.

Небольшой отказ от ответственности: эти шаги явно основаны на том, что я узнал, и я использовал эти шаги всякий раз, когда работал над проектом машинного обучения.

Объем проекта

Первое, что вы должны сделать, это определить масштаб проекта (другое слово: определить проект). Выбор проекта и над каким проектом вы хотите работать. Например, в рамках моего проекта по классификации изображений я хочу классифицировать марку автомобиля, сфотографировав ее на свой смартфон.

Собирать данные

Подумав о проекте, вам нужно решить, где я могу получить набор данных для вашего проекта. Собирая данные самостоятельно или просто взяв один из наборов данных с таких веб-сайтов, как Поисковая система наборов данных Google, Документы с кодом, Репозиторий машинного обучения UCI и Наборы данных Kaggle. Есть и другие места, где вы можете получить набор данных для своего проекта.

Обратите внимание: ваш набор данных должен быть легальным и защищенным от авторских прав.

Модель поезда

После того, как у вас есть данные, вы можете приступить к обучению своей модели. Вы должны проводить анализ ошибок и итеративно улучшать свою модель.

Вы можете вернуться и собрать дополнительные данные после выполнения анализа ошибок или определения того, является ли это переоснащением или недостатком. Возможно, соберите дополнительные данные о каждой функции в вашем наборе данных или просто сосредоточьтесь на сборе данных о ключевых аспектах, на которых анализ ошибок предлагает вам сосредоточиться на улучшении вашей модели или на переоснащении и недообучении.

Вот пример шагов, которые я мог бы придумать при обучении модели:

Если вам интересно, как разделить поезд, действительный и тестовый набор, или хотите узнать, почему мы должны создавать эти три части, вот мой блог:

Почему (как) мы разделяем обучение, валидацию и тестирование?
Во время кодирования вашего проекта машинного обучения или изучения машинного обучения вы не запутались в данных, которые нужно разделить… medium.com

Развертывание в производстве

После улучшения вашей модели пришло время сделать вашу модель машинного обучения доступной для использования пользователями, что означает, что вам нужно развернуть свою модель. При развертывании системы также необходимо продолжать отслеживать ее производительность.

Если производительность в производственной среде ухудшится, вы можете вернуться к этапу обучения или, возможно, собрать еще больше данных вместо того, чтобы пока размещать свою модель.

Вот полная схема этих шагов:

Если вы хотите увидеть приведенные выше цифры вживую, смотрите здесь.

Заключение

Вот как вы могли бы рассматривать этапы ценного проекта. Надеюсь, это вам очень помогло.

Там может быть много других эффективных шагов, но простое следование шагам может привести к успешному проекту. Если вы хотите что-то предложить или узнать что-то более эффективное, вы можете написать мне или оставить комментарий в этом блоге. Это может помочь другим.

Ссылка

Расширенные алгоритмы обучения Эндрю Нг

Если вам нравится читать мои блоги, вы можете следить за мной на Medium

Если у вас возникли проблемы или вы хотите связаться со мной, напишите мне по электронной почте

Вы также можете следить за публикацией Artificialis, где я в основном публикую свои блоги.