Начинающие инженеры машинного обучения / специалисты по данным обычно думают, что их работа только что закончена, когда они просто обучают «хорошую» модель с точки зрения точности, воспроизводимости и т. д.

Неправильный ! , ваша работа только началась . Заинтересованные стороны (владелец продукта, бизнес-клиент или даже обычный конечный пользователь) спросят вас:

Почему модель дает нам эти прогнозы/рекомендации?

Легко спросить, трудно ответить. Но почему? По двум причинам:
i) трудно найти первопричину для конкретной рекомендации/прогноза
ii) трудно убедительно донести это до заинтересованных сторон, особенно нетехнических те.

Позвольте мне привести несколько примеров типичных ситуаций/вопросов, чтобы показать, насколько важна эта тема, особенно. к моделям машинного обучения, связанным с отраслью/бизнесом

Контекст обучения для ранжирования
Клиент X ожидал, что результаты Y окажутся на верхней позиции в рейтинге, поэтому он получил результат на третьем месте . Рекомендации этой модели не имеют никакого смысла!

Контекст прогноза цен на акции

Прогнозируется, что акции s сильно упадут в цене к моменту времени t. Наш эксперт по доменам говорит, что с этими акциями такого никогда не случалось. Ваша модель - мусор!

Теперь у вас есть представление о том, почему проблема важна. Во второй части я разобью проблему на две основные подзадачи, дав обзор того, как решать каждую из них.

Ссылки