Книгу написали Валиаппа Лакшманан, Сара Робинсон и Майкл Манн.

Хорошая книга с громким названием. Авторы утверждают, что «собрали лучшие практики и решения повторяющихся проблем в машинном обучении», и это именно то, что они предлагают.

В книге представлены шаблоны для проектирования, представления проблем, обучения, обслуживания. Несмотря на то, что он охватывает все этапы жизненного цикла машинного обучения, он ни в коем случае не является поверхностным. Каждый шаблон описывает проблему, решение, другие жизнеспособные альтернативы и необходимый объем кода (ориентированный на стек Google).

Вам определенно нужны некоторые предварительные знания, чтобы оценить книгу, и я уверен, что вы не сможете использовать все в своей работе, потому что она охватывает так много вопросов.

Мои личные особенности:

  • Многое узнал о вложениях (для обработки категориальных функций) и шаблоне перебалансировки (для работы с несбалансированными наборами данных).
  • Шаблоны переформирования и повторяющегося разделения открыли мне глаза на то, как планировать и решать проблемы машинного обучения. Решите, когда использовать регрессию или классификацию и как разделить набор данных в зависимости от проблемы, чтобы получить достойный результат.
  • Как можно использовать разные шаблоны для решения одной и той же проблемы: мультимодальные входы, эмсамблирование, каскадирование.
  • Так много узнал об обслуживании ML: функция обслуживания без сохранения состояния (онлайн-прогнозы) и пакетное обслуживание (прогнозы, предварительно обработанные в автономном режиме для улучшения взаимодействия с пользователем). Продолжение оценки модели (для мониторинга производительности и проверки дрейфа).
  • Мне также понравился контент, который, я надеюсь, мы скоро будем использовать в работе: шаблон Workflow Pipeline (MLOps), шаблон Windowed Inference (работа с данными в реальном времени) и шаблон Feature Store (подготовка функций для каталогизации и повторного использования в моделях).

Мне очень понравилось, и я определенно рекомендую книгу инженерам данных, специалистам по данным или инженерным менеджерам, таким как я. Я нахожу невероятным, сколько знаний у авторов по этому вопросу, и я очень хочу поговорить с ними на собрании нашего книжного клуба =)