Развертывание модели машинного обучения (ML) стажером 😅

Методы развертывания и платформы

Когда я слышу о модели, мне на ум приходит масштабный образец любого предмета, скажем, масштабный образец здания или города, созданный архитектором, масштабный образец торта, созданный пекарем, или образец выпечки, созданный кондитером. В мире данных модели машинного обучения не масштабируются, а являются частью законченного продукта, обеспечивающего практические решения конкретной проблемы или преимущества для бизнеса.

Развертывание модели машинного обучения — один из последних этапов жизненного цикла машинного обучения. Этот процесс позволяет модели демонстрировать свои знания и применять их в производстве для получения реальной ценности. Лучший метод развертывания модели определяется несколькими факторами, такими как:

Как часто ваша модель должна генерировать прогнозы?
Должны ли результаты модели основываться на отдельных случаях или на пакетах (маленьких/больших) случаев?
Какую вычислительную мощность и объем памяти вы можете выделить для модели?
Как скоро нужны результаты?
Есть ли эксплуатационные и финансовые последствия для поддержания модели

Существует два (2) широко распространенных метода развертывания и несколько платформ развертывания.

Методы развертывания модели

Пакетный вывод и вывод в реальном времени (интерактивный) или онлайн-вывод.

Пакетный вывод

Работать в пакетах означает генерировать/создавать коллективно и периодически. Этот метод запускается через определенные промежутки времени и предоставляет результаты для набора данных, созданных в результате предыдущего запуска. Это полезно, когда результаты модели не нужны в режиме реального времени.

Преимущество заключается в том, что он не требует большого вычислительного пространства и большого хранилища данных. Поскольку ограничений по задержке нет, вы можете развертывать более сложные модели, которые могут обеспечить более точные результаты.

Вывод в реальном времени

При выводе в реальном времени модель доступна круглосуточно и без выходных и предоставляет результаты в режиме реального времени и по запросу. Хотя в большинстве случаев это звучит как желательная функция, ограничение задержки ограничивает. Поскольку результаты ожидаются в режиме реального времени, вы не можете использовать сложные модели. Кроме того, это требует больших вычислительных ресурсов, поскольку модель должна быть готова к запуску в любое время.

Платформы развертывания моделей

Машинное обучение Azure
ML поток
Бумажное пространство
КубеФлоу
Лаборатория данных Домино
Облачная кора Google
Seldon.io
AWS Sagemaker
БентолМЛ
Обслуживание TensorFlow
Touchserve

Развертывание модели машинного обучения (ML) стажером 😅

Методы развертывания модели

Пакетный вывод

Вывод в реальном времени

Платформы развертывания моделей

Рекомендации

Вопросы по теме