В этом посте мы изучим 3 фреймворка управления проектами и 1 навык, которые помогут специалистам по данным направлять проекты к успеху.

Большинство проектов по науке о данных — это проекты с фиксированным временем и ограниченным бюджетом. Хотя это нормально, что у проектов по науке о данных есть некоторое свободное время из-за их научной природы, тот факт, что ресурсы (время, деньги или люди) ограничены, оправдывает необходимость тщательного планирования проектов по науке о данных. В конце концов, вы хотите, чтобы заинтересованные стороны были довольны, а хорошее планирование формирует ожидания и контролирует выполнение проекта.

Это особенно актуально для консалтинговых проектов, где отклонение от первоначального плана может иметь катастрофические последствия. Финансовые стимулы должны быть согласованы с реализацией проекта, и любые проекты с превышением бюджета или незавершенные проекты обычно возникают из-за плохого планирования.

Несмотря на то, что проекты по науке о данных имеют вероятность провала, причины этого провала должны основываться на статистической гипотезе, а не на отсутствии планирования.

И, да, это не главная обязанность специалиста по обработке и анализу данных — управлять проектами сверху донизу, но изучение некоторых фреймворков определенно поможет понять определенные проектные решения и конструктивно участвовать в управлении проектом до успеха. Еще одним преимуществом является то, что изучение некоторых навыков и основ управления проектами поможет вам подняться по карьерной лестнице до руководящих должностей, поскольку эти навыки становятся еще более актуальными по мере того, как вы повышаете свою ответственность.

В этом посте мы познакомимся с некоторыми соответствующими структурами управления проектами или навыками для специалистов по данным. Итак, давайте перейдем к некоторым концепциям, которые могут быть полезны для вашей повседневной работы в качестве специалиста по данным или менеджера в мире данных!

Небольшое примечание: из-за своей специфики большинство проектов по науке о данных сопряжено с большим количеством неопределенности (отсюда и слово "наука" в его названии). К этим концепциям всегда следует относиться с долей скептицизма, а не применять их вслепую.

ИПЕКК — Структура

IPECC расшифровывается как Initiation — Planning — Execution — Controlling — Closure. Это общая структура, используемая менеджерами проектов для отслеживания проектов и понимания того, как проект развертывается.

В то время как структура IPECC имеет некоторые стандартные задачи для каждой фазы, я объясню, как их можно использовать в контексте типичных проектов по науке о данных. Давайте рассмотрим каждую фазу.

Посвящение

Этап инициации является одним из наиболее важных этапов структуры проекта. Здесь происходит определение масштаба проекта и определение важных заинтересованных сторон. Некоторые из общих задач этого этапа в контексте науки о данных:

  • Понимание ключевых заинтересованных сторон проекта;
  • Понимание того, какие источники данных доступны для проекта;
  • Оценка сложности интеграции данных и ожидаемых временных затрат;
  • Определение проблемы и составление плана доступных решений;
  • Определить срок для проекта;

Планирование

На этапе планирования вся информация, собранная на этапе инициации, будет преобразована в общий план, который должен быть одобрен всеми заинтересованными сторонами.

Этап планирования также помогает с двумя важными моментами: разделение задач между членами команды и построение общего потока проекта. Некоторые задачи планирования, относящиеся к проектам по науке о данных:

  • Разработка графика разработки модели, включая расположение ключевых контрольных точек и встреч с заинтересованными сторонами.
  • Разработайте график интеграции данных, разработки базовой модели и улучшения модели.
  • Оцените имеющиеся ограничения для разработки проекта (например, объяснимость моделей, разумное время обучения и т. д.);

Очень важно также оставить место для «творческих задач». Очень часто новые идеи появляются во время разработки проекта, и планирование времени для некоторых экспериментов будет иметь ключевое значение для установления ожиданий заинтересованных сторон.

Исполнение и контроль

Эти две фазы обычно происходят одновременно и составляют основу разработки проекта. Выполнение — это развитие проекта, а контроль — это постоянная оценка выполнения по сравнению с первоначальным планом.

Общие задачи для обоих этапов:

  • Отслеживание графика по сравнению с планированием. Сравнение наличия задержек проекта или оценка риска проекта.
  • Отслеживайте взаимодействие с заинтересованными сторонами, особенно если выполняются первоначальные требования.
  • Регулярные встречи между техническими командами и бизнес-партнерами.
  • И, конечно же, разработка самой модели(ей).

Закрытие

На этапе закрытия проект представляется, и основные выводы обсуждаются с заинтересованными сторонами. Для проектов по науке о данных это наиболее важные задачи:

  • Узнайте, были ли достигнуты бизнес-цели.
  • Обсуждение результата проекта — в случае неудачной гипотезы обсудите выгоду от новых знаний. Несостоятельная гипотеза может быть столь же ценной, как и подтвержденная, в зависимости от бизнес-контекста.
  • Инкапсулировать соответствующую документацию и передать проект конечному участнику — каждый специалист по данным должен заботиться о двух аспектах: 1) других разработчиках/специалистах по данным, которым потребуется поддерживать решение в будущем, и 2) бизнес-пользователях. который будет использовать выходные данные в конкретных случаях использования.

Управление рисками — структура

Фреймворки управления рисками помогают планировать неопределенность и лучше строить вероятности событий, которые могут саботировать ваш проект по науке о данных.

Выявление и оценка этих рисков является ключом к созданию путей эвакуации и планов по предотвращению хаоса. Каждый этап проекта связан с риском – для проектов по науке о данных наиболее распространенные риски связаны с ресурсами и данными.

Ниже приведены некоторые примеры рисков, которые могут быть важны для отображения в течение жизненного цикла проекта:

  • Что произойдет, если один из моих специалистов по данным покинет команду (из-за болезни, добровольного ухода и т. д.)?
  • Что произойдет, если мы не сможем работать с источниками данных, которые нам нужны для обучения нашей модели?
  • Существует ли регуляторный риск, связанный с какими-либо данными, содержащимися в моих источниках данных?

Размышление о рисках заставляет вас составить план по их снижению. Структуры управления рисками помогут отобразить и спланировать неопределенность, присущую проекту.

Прочтите этот сообщение в блоге, если вы хотите узнать немного больше о рисках и общей схеме из 6 шагов для их устранения.

Эпики и пользовательские истории — Framework

Эпики и пользовательские истории не являются чем-то новым для специалистов по данным, работающих в Agile-командах.

Эпики – это набор высокоуровневых задач, которые могут представлять собой несколько пользовательских историй. Написание хорошего Эпика является ключом к тому, чтобы соответствовать ожиданиям заинтересованных сторон. Вообразите себе Инициатива Data Science по созданию «Системы прогнозирования продаж для компании, производящей мороженое». Примером двух эпопей может быть:

  • "Как менеджеру по продажам, мне нужно понимать, на каких регионах мне нужно сосредоточить свои внешние усилия на основе прогноза продаж"
  • "Как менеджеру по логистике, мне нужно оценить спрос, чтобы я мог соответствующим образом подготовить наше производство"

Для науки о данных Эпики помогают сопоставить результаты модели и определить правильных заинтересованных лиц для проекта.

Основываясь на приведенных выше примерах, мы сразу поняли бы, что нам следует включить в цикл проекта как команду логистики, так и группу продаж. Почему это актуально? Представьте, что позже вы обнаружите, что менеджерам по логистике нужен ежедневный прогноз, а менеджерам по продажам — еженедельный. Это немедленно изменит способ всей вашей разработки, изменит способ организации конвейера данных, поскольку вам потребуется ежедневный прогноз. детализированность.

Истории пользователей – это небольшие фрагменты эпиков, содержащие более подробное описание конкретных потребностей, например, в нашем примере с группой логистики:

  • «Как менеджеру по логистике, мне нужно видеть прогноз на моей производственной панели»;
  • "Как менеджеру по логистике, мне нужно смоделировать, как прогнозы погоды могут изменить прогноз";

Эти низкоуровневые «истории» могут изменить ваш результат и помочь вам разбить вашу работу на определенные части. Как вы можете себе представить, Эпики и Истории пользователей неотъемлемо связаны с планированием проекта.

Интегрированные в Agile-среды, эти концепции очень важны для управления заинтересованными сторонами и они направлены на то, чтобы избежать двух наиболее распространенных ошибок в проектах:

  • Неправильное построение;
  • Создание чего-то, что подходит только очень небольшой части организации;

Постоянная связь — навык

Еще один навык, который развивают менеджеры проектов, — это постоянное общение и ценная обратная связь.

Почему это важно для специалистов по данным? Специалисты по обработке и анализу данных должны иметь возможность четко сообщать о своих результатах и ​​транслировать сложность моделей обработки данных для заинтересованных сторон. В частности, специалисты по данным не должны быть «инженерами из башни из слоновой кости» — развитие хороших коммуникативных навыков — хороший шаг к построению более эмоциональных отношений с коллегами и заинтересованными сторонами.

Постоянное общение и четкая обратная связь — это действительно особый навык, который можно использовать, например, на нескольких этапах проекта:

  • сообщение об улучшениях модели
  • запрашивать отзывы заинтересованных сторон;
  • включение новой информации в разработку проекта;
  • предоставление отзывов другим разработчикам об их коде;

В целом, постоянное общение — это способ предотвратить ограждение заинтересованных сторон от разработки проекта, повышая вероятность успеха проекта.

Спасибо, что нашли время, чтобы прочитать этот пост! Вот некоторые из навыков, которые я пытался улучшить, и принципы, которые я пытался применить, чтобы стать лучшим специалистом по данным. Как я уже сказал, их применение не является обязательным для специалистов по обработке и анализу данных — на сегодняшний день основная цель специалистов по данным по-прежнему заключается в разработке хороших моделей — но я действительно считаю, что они являются отличным дополнением для повышения вероятности получения хороших результатов. результаты проекта, и, в конце концов, мы все хотим, чтобы наши проекты шли к успеху.

Хотите что-то добавить? Пишите в комментариях ниже!

Я подготовил курс по изучению науки о данных в R с нуля на Udemy — курс рассчитан на начинающих, содержит более 100 упражнений, и мне бы хотелось, чтобы вы были рядом!