Около месяца назад (в момент сильного завала с одним своим проектом) я полистал ссылки про управление проектами в области data science «от обратного» - почему они грохаются/не взлетают, вот выжимка:
-
http://www.ciodive.com/news/4-reasons-why-most-data-science-projects-fail/439637/
Starting with the wrong questions (если стартовый вопрос «а давайте все исследуем» - его нужно уточнять)
Weak stakeholder buy-in (для «веры в проект» заинтересованные лица должны план/стратегию/roadmap и прогресс по нему + возможность влиять и «настраивать проект»)
Lack of diverse expertise (нельзя поручить только айтишникам)
- http://dataconomy.com/2016/06/3-reasons-why-data-science-can-fail/
ЗДЕСЬ БОЛЬШЕ ПРО ВНУТРЕННИЕ ДАННЫЕ В СОБСТВЕННЫХ ПРОДУКТАХ ПРОГРАММНЫХ, НО ПРОБЛЕМЫ СФОРМУЛИРОВАНЫ ЧЕТКО:
1.SOLVING THE WRONG PROBLEM
2.MISMATCH OF PROBLEM, TECHNOLOGY AND PERSONNEL
3.DATA INTEGRITY
- http://www.oralytics.com/2016/08/why-data-science-projects-fail.html
Очень подробный список «болевых точек» и чеклист «зачем мы это делаем», наверное самое полное
- http://www.martingoodson.com/ten-ways-your-data-project-is-going-to-fail/
Рассказ в лицах про Data Scientist, дата-инженера и бизнес-аналитика. У них DS это такой методолог в области оптимизации. Издеваются над проектными менеджерами.
http://www.kdnuggets.com/2016/12/top-reasons-big-data-science-analytics-fail.html
(В целом подтверждает предыдущие списки)
По ролям / уровням анализа для нового data science проекта вижу следующее:
Планирование:
-
Критерии успеха (задает стейкхолдер, популярность, цитируемость, и т.д.)
-
Вопросы исследования, гипотезы, тезисы (уточняется исследователями и участниками команды)
Роли в Data Science (data scientist’ом называют любую комбинацию этих ролей c акцентом на методологию):
-
Данные – data engineer / ETL (extract/transform/load)
-
Дескриптивная статистика и структура данных – бизнес-аналитик
-
Интерпретируемые модели – эконометрист
-
Визуализация – рисует графики / инфографику (как програмирование, так и дизайн)
Результаты и распространение:
-
Продукт – что-то что приносит пользу потребителю / стейкхолдеру
-
Коммуникации – распространение результатов и обратная связь с аудиторией
Опционально: поддержка и развитие сайта/серии приложений под одним брендом/организацией.