В этом посте мы изучим 3 фреймворка управления проектами и 1 навык, которые помогут специалистам по данным направлять проекты к успеху.
Большинство проектов по науке о данных — это проекты с фиксированным временем и ограниченным бюджетом. Хотя это нормально, что у проектов по науке о данных есть некоторое свободное время из-за их научной природы, тот факт, что ресурсы (время, деньги или люди) ограничены, оправдывает необходимость тщательного планирования проектов по науке о данных. В конце концов, вы хотите, чтобы заинтересованные стороны были довольны, а хорошее планирование формирует ожидания и контролирует выполнение проекта.
Это особенно актуально для консалтинговых проектов, где отклонение от первоначального плана может иметь катастрофические последствия. Финансовые стимулы должны быть согласованы с реализацией проекта, и любые проекты с превышением бюджета или незавершенные проекты обычно возникают из-за плохого планирования.
Несмотря на то, что проекты по науке о данных имеют вероятность провала, причины этого провала должны основываться на статистической гипотезе, а не на отсутствии планирования.
И, да, это не главная обязанность специалиста по обработке и анализу данных — управлять проектами сверху донизу, но изучение некоторых фреймворков определенно поможет понять определенные проектные решения и конструктивно участвовать в управлении проектом до успеха. Еще одним преимуществом является то, что изучение некоторых навыков и основ управления проектами поможет вам подняться по карьерной лестнице до руководящих должностей, поскольку эти навыки становятся еще более актуальными по мере того, как вы повышаете свою ответственность.
В этом посте мы познакомимся с некоторыми соответствующими структурами управления проектами или навыками для специалистов по данным. Итак, давайте перейдем к некоторым концепциям, которые могут быть полезны для вашей повседневной работы в качестве специалиста по данным или менеджера в мире данных!
Небольшое примечание: из-за своей специфики большинство проектов по науке о данных сопряжено с большим количеством неопределенности (отсюда и слово "наука" в его названии). К этим концепциям всегда следует относиться с долей скептицизма, а не применять их вслепую.
ИПЕКК — Структура
IPECC расшифровывается как Initiation — Planning — Execution — Controlling — Closure. Это общая структура, используемая менеджерами проектов для отслеживания проектов и понимания того, как проект развертывается.
В то время как структура IPECC имеет некоторые стандартные задачи для каждой фазы, я объясню, как их можно использовать в контексте типичных проектов по науке о данных. Давайте рассмотрим каждую фазу.
Посвящение
Этап инициации является одним из наиболее важных этапов структуры проекта. Здесь происходит определение масштаба проекта и определение важных заинтересованных сторон. Некоторые из общих задач этого этапа в контексте науки о данных:
- Понимание ключевых заинтересованных сторон проекта;
- Понимание того, какие источники данных доступны для проекта;
- Оценка сложности интеграции данных и ожидаемых временных затрат;
- Определение проблемы и составление плана доступных решений;
- Определить срок для проекта;
Планирование
На этапе планирования вся информация, собранная на этапе инициации, будет преобразована в общий план, который должен быть одобрен всеми заинтересованными сторонами.
Этап планирования также помогает с двумя важными моментами: разделение задач между членами команды и построение общего потока проекта. Некоторые задачи планирования, относящиеся к проектам по науке о данных:
- Разработка графика разработки модели, включая расположение ключевых контрольных точек и встреч с заинтересованными сторонами.
- Разработайте график интеграции данных, разработки базовой модели и улучшения модели.
- Оцените имеющиеся ограничения для разработки проекта (например, объяснимость моделей, разумное время обучения и т. д.);
Очень важно также оставить место для «творческих задач». Очень часто новые идеи появляются во время разработки проекта, и планирование времени для некоторых экспериментов будет иметь ключевое значение для установления ожиданий заинтересованных сторон.
Исполнение и контроль
Эти две фазы обычно происходят одновременно и составляют основу разработки проекта. Выполнение — это развитие проекта, а контроль — это постоянная оценка выполнения по сравнению с первоначальным планом.
Общие задачи для обоих этапов:
- Отслеживание графика по сравнению с планированием. Сравнение наличия задержек проекта или оценка риска проекта.
- Отслеживайте взаимодействие с заинтересованными сторонами, особенно если выполняются первоначальные требования.
- Регулярные встречи между техническими командами и бизнес-партнерами.
- И, конечно же, разработка самой модели(ей).
Закрытие
На этапе закрытия проект представляется, и основные выводы обсуждаются с заинтересованными сторонами. Для проектов по науке о данных это наиболее важные задачи:
- Узнайте, были ли достигнуты бизнес-цели.
- Обсуждение результата проекта — в случае неудачной гипотезы обсудите выгоду от новых знаний. Несостоятельная гипотеза может быть столь же ценной, как и подтвержденная, в зависимости от бизнес-контекста.
- Инкапсулировать соответствующую документацию и передать проект конечному участнику — каждый специалист по данным должен заботиться о двух аспектах: 1) других разработчиках/специалистах по данным, которым потребуется поддерживать решение в будущем, и 2) бизнес-пользователях. который будет использовать выходные данные в конкретных случаях использования.
Управление рисками — структура
Фреймворки управления рисками помогают планировать неопределенность и лучше строить вероятности событий, которые могут саботировать ваш проект по науке о данных.
Выявление и оценка этих рисков является ключом к созданию путей эвакуации и планов по предотвращению хаоса. Каждый этап проекта связан с риском – для проектов по науке о данных наиболее распространенные риски связаны с ресурсами и данными.
Ниже приведены некоторые примеры рисков, которые могут быть важны для отображения в течение жизненного цикла проекта:
- Что произойдет, если один из моих специалистов по данным покинет команду (из-за болезни, добровольного ухода и т. д.)?
- Что произойдет, если мы не сможем работать с источниками данных, которые нам нужны для обучения нашей модели?
- Существует ли регуляторный риск, связанный с какими-либо данными, содержащимися в моих источниках данных?
Размышление о рисках заставляет вас составить план по их снижению. Структуры управления рисками помогут отобразить и спланировать неопределенность, присущую проекту.
Прочтите этот сообщение в блоге, если вы хотите узнать немного больше о рисках и общей схеме из 6 шагов для их устранения.
Эпики и пользовательские истории — Framework
Эпики и пользовательские истории не являются чем-то новым для специалистов по данным, работающих в Agile-командах.
Эпики – это набор высокоуровневых задач, которые могут представлять собой несколько пользовательских историй. Написание хорошего Эпика является ключом к тому, чтобы соответствовать ожиданиям заинтересованных сторон. Вообразите себе Инициатива Data Science по созданию «Системы прогнозирования продаж для компании, производящей мороженое». Примером двух эпопей может быть:
- "Как менеджеру по продажам, мне нужно понимать, на каких регионах мне нужно сосредоточить свои внешние усилия на основе прогноза продаж"
- "Как менеджеру по логистике, мне нужно оценить спрос, чтобы я мог соответствующим образом подготовить наше производство"
Для науки о данных Эпики помогают сопоставить результаты модели и определить правильных заинтересованных лиц для проекта.
Основываясь на приведенных выше примерах, мы сразу поняли бы, что нам следует включить в цикл проекта как команду логистики, так и группу продаж. Почему это актуально? Представьте, что позже вы обнаружите, что менеджерам по логистике нужен ежедневный прогноз, а менеджерам по продажам — еженедельный. Это немедленно изменит способ всей вашей разработки, изменит способ организации конвейера данных, поскольку вам потребуется ежедневный прогноз. детализированность.
Истории пользователей – это небольшие фрагменты эпиков, содержащие более подробное описание конкретных потребностей, например, в нашем примере с группой логистики:
- «Как менеджеру по логистике, мне нужно видеть прогноз на моей производственной панели»;
- "Как менеджеру по логистике, мне нужно смоделировать, как прогнозы погоды могут изменить прогноз";
Эти низкоуровневые «истории» могут изменить ваш результат и помочь вам разбить вашу работу на определенные части. Как вы можете себе представить, Эпики и Истории пользователей неотъемлемо связаны с планированием проекта.
Интегрированные в Agile-среды, эти концепции очень важны для управления заинтересованными сторонами и они направлены на то, чтобы избежать двух наиболее распространенных ошибок в проектах:
- Неправильное построение;
- Создание чего-то, что подходит только очень небольшой части организации;
Постоянная связь — навык
Еще один навык, который развивают менеджеры проектов, — это постоянное общение и ценная обратная связь.
Почему это важно для специалистов по данным? Специалисты по обработке и анализу данных должны иметь возможность четко сообщать о своих результатах и транслировать сложность моделей обработки данных для заинтересованных сторон. В частности, специалисты по данным не должны быть «инженерами из башни из слоновой кости» — развитие хороших коммуникативных навыков — хороший шаг к построению более эмоциональных отношений с коллегами и заинтересованными сторонами.
Постоянное общение и четкая обратная связь — это действительно особый навык, который можно использовать, например, на нескольких этапах проекта:
- сообщение об улучшениях модели
- запрашивать отзывы заинтересованных сторон;
- включение новой информации в разработку проекта;
- предоставление отзывов другим разработчикам об их коде;
В целом, постоянное общение — это способ предотвратить ограждение заинтересованных сторон от разработки проекта, повышая вероятность успеха проекта.
Спасибо, что нашли время, чтобы прочитать этот пост! Вот некоторые из навыков, которые я пытался улучшить, и принципы, которые я пытался применить, чтобы стать лучшим специалистом по данным. Как я уже сказал, их применение не является обязательным для специалистов по обработке и анализу данных — на сегодняшний день основная цель специалистов по данным по-прежнему заключается в разработке хороших моделей — но я действительно считаю, что они являются отличным дополнением для повышения вероятности получения хороших результатов. результаты проекта, и, в конце концов, мы все хотим, чтобы наши проекты шли к успеху.
Хотите что-то добавить? Пишите в комментариях ниже!
Я подготовил курс по изучению науки о данных в R с нуля на Udemy — курс рассчитан на начинающих, содержит более 100 упражнений, и мне бы хотелось, чтобы вы были рядом!