Методы развертывания и платформы

Когда я слышу о модели, мне на ум приходит масштабный образец любого предмета, скажем, масштабный образец здания или города, созданный архитектором, масштабный образец торта, созданный пекарем, или образец выпечки, созданный кондитером. В мире данных модели машинного обучения не масштабируются, а являются частью законченного продукта, обеспечивающего практические решения конкретной проблемы или преимущества для бизнеса.

Развертывание модели машинного обучения — один из последних этапов жизненного цикла машинного обучения. Этот процесс позволяет модели демонстрировать свои знания и применять их в производстве для получения реальной ценности. Лучший метод развертывания модели определяется несколькими факторами, такими как:

  • Как часто ваша модель должна генерировать прогнозы?
  • Должны ли результаты модели основываться на отдельных случаях или на пакетах (маленьких/больших) случаев?
  • Какую вычислительную мощность и объем памяти вы можете выделить для модели?
  • Как скоро нужны результаты?
  • Есть ли эксплуатационные и финансовые последствия для поддержания модели

Существует два (2) широко распространенных метода развертывания и несколько платформ развертывания.

Методы развертывания модели

Пакетный вывод и вывод в реальном времени (интерактивный) или онлайн-вывод.

Пакетный вывод

Работать в пакетах означает генерировать/создавать коллективно и периодически. Этот метод запускается через определенные промежутки времени и предоставляет результаты для набора данных, созданных в результате предыдущего запуска. Это полезно, когда результаты модели не нужны в режиме реального времени.

Преимущество заключается в том, что он не требует большого вычислительного пространства и большого хранилища данных. Поскольку ограничений по задержке нет, вы можете развертывать более сложные модели, которые могут обеспечить более точные результаты.

Вывод в реальном времени

При выводе в реальном времени модель доступна круглосуточно и без выходных и предоставляет результаты в режиме реального времени и по запросу. Хотя в большинстве случаев это звучит как желательная функция, ограничение задержки ограничивает. Поскольку результаты ожидаются в режиме реального времени, вы не можете использовать сложные модели. Кроме того, это требует больших вычислительных ресурсов, поскольку модель должна быть готова к запуску в любое время.

Платформы развертывания моделей

  • Машинное обучение Azure
  • ML поток
  • Бумажное пространство
  • КубеФлоу
  • Лаборатория данных Домино
  • Облачная кора Google
  • Seldon.io
  • AWS Sagemaker
  • БентолМЛ
  • Обслуживание TensorFlow
  • Touchserve

Рекомендации

Пакетный инференс против онлайн-инференса — машинное обучение в производстве

3 шага к эффективному развертыванию модели машинного обучения (aimultiple.com)

8 лучших инструментов для развертывания модели машинного обучения, которые вам нужно знать — neptune.ai