Эксперименты по отслеживанию не распространены среди специалистов по анализу данных. Однако отслеживание имеет много преимуществ.

Отслеживание экономит время

Сколько раз вы повторяли обучение модели с одними и теми же параметрами снова и снова?

Отслеживая эксперименты (активность по регистрации параметров, зависимости результатов, код и данные), вы можете вернуться в прошлое и проверить, какие параметры, результаты и данные использовались для достижения наилучшего результата.

Отслеживание также экономит ваше время, зная, какие зависимости и версия были использованы. Это полезно, когда вы развертываете свою модель и хотите знать, какой пакет находится в производстве.

Отслеживание также может помочь вам воспроизвести результаты конкретного эксперимента, если вы не сохранили свою модель.

Отслеживание сэкономить деньги

В контексте глубокого обучения и больших наборов данных эксперименты в облачной среде могут стоить от сотен до тысяч долларов.

Отслеживание ваших экспериментов поможет вам избежать переобучения моделей с одинаковыми параметрами и избежать длительного и дорогостоящего обучения больших моделей DL.

При обучении модели DL полезно отслеживать модель с данными эксперимента, чтобы избежать воспроизведения экспериментов.

Отслеживание улучшает сотрудничество

Все больше и больше специалистов по данным сотрудничают, делясь кодом и данными.

К сожалению, специалистам по данным, которые владеют этими данными и кодом, приходится выяснять производительность и зависимости моделей.

Отслеживая и обмениваясь экспериментами, другие специалисты по данным могут быстрее выяснить поведение моделей и избежать ошибок, связанных с зависимостями кода.

Инструменты для отслеживания ваших экспериментов

Сегодня существует множество инструментов для отслеживания ваших экспериментов.

Mlflow (mlflow.org): платформа с открытым исходным кодом для жизненного цикла машинного обучения.

Sacred (github.com/IDSIA/sacred): Sacred - это инструмент, помогающий настраивать, организовывать, регистрировать и воспроизводить эксперименты.

Comet (www.comet.ml): Comet позволяет отслеживать код, эксперименты и результаты проектов машинного обучения. Это быстро, просто и бесплатно для проектов с открытым исходным кодом.

Datmo (www.datmo.com): инструмент с открытым исходным кодом для отслеживания и воспроизводимости экспериментов по машинному обучению.

MokaML - это платформа для специалистов по данным , которая позволяет разрабатывать, экспериментировать и развертывать ваши модели в одном месте. Посетите нас на mokaml.ai.