Если вы начинаете или переключаете свою карьеру на науку о данных, вы часто сталкиваетесь с этим вопросом: «Нужна ли мне математика, чтобы стать успешным специалистом по данным?» Тем более, когда вы не так хороши в математике и все еще хотите заняться наукой о данных. Когда я начинал свой путь в качестве специалиста по данным, я часто сталкивался с этим вопросом в нескольких блогах и от нескольких новых энтузиастов, пытающихся ступить на эту знаменитую «самую сексуальную работу 21 века». Многие из вас, возможно, даже сталкивались с какой-либо формой этой знаменитой диаграммы с тремя кругами (иногда расширяемой до 4 или более), где 1 круг почти всегда представляет собой математику и статистику, как показано ниже.

Большинство статистиков, ставших учеными данных, готовы поклясться богом, что быть успешным специалистом по данным — это квинтэссенция навыков (не те специалисты по данным, которые думают, что наука о данных — это все о причудливых моделях и показателях точности). Но даже до того, как углубиться в то, сколько математики необходимо, необходимо абсолютно ясно понять, каким специалистом по данным вы хотите быть. По моему опыту, это гораздо более важный вопрос, чем вопрос о том, сколько математики и нужна ли математика.

На мой взгляд, существует по крайней мере 3 основных типа специалистов по данным:
1. Тот эксперт по данным, который создал диаграммы Венна, подобные приведенным выше: специалист по данным. кто может построить свои собственные алгоритмы для решения сложных задач. Этот тип ученого данных обращается к ручке и бумаге, чтобы сначала написать логическую структуру/псевдокод для своего алгоритма, а затем систематизировать свою логику. Для них не важен язык программирования, на котором они кодируют, важна логика и уравнения!
2. Гражданин по данным, который понимает концепции науки о данных и может применять их в некоторой степени. настроить алгоритмы, написанные первыми специалистами по данным. Эти специалисты по данным — это те, кто знаком с несколькими пакетами определенного языка программирования и освоил их применение. Их лучшие друзья — Google и stackoverflow. Их логика может быть не самой лучшей, но они дают вам решение. Им легко стать жертвой точности и других показателей оценки
3. Переводчик данных, чьи навыки мало похожи на гражданских специалистов по данным, но именно они иметь другие области знаний, такие как глубокие знания предметной области, деловая хватка, глубокое понимание бизнес-проблем и потребностей заинтересованных сторон. Для них наука/технология о данных — это просто средство для решения бизнес-задачи. Они больше сосредоточены на интерпретируемости и объяснимости моделей и их способности решать поставленный вопрос, а не на точности, математике, коде, алгоритме или модели.

Как только вы поймете, кем вы являетесь или хотите быть, легко узнать, сколько математики вам нужно. Если вы говорите только об одном типе, у вас может сложиться предвзятое мнение о том, сколько математики необходимо. Опытные специалисты по данным часто гордятся своей способностью создавать собственные уравнения и алгоритмы и считают математику центром всего в науке о данных. Как правило, они имеют докторскую степень и ценят вас как специалиста по данным только в том случае, если у вас есть хорошие математические/статистические знания и (обычно) степень доктора философии. Второй тип скажет вам, что математика — это реклама, просто изучите основы и изучите основы, такие как линейная алгебра, исчисление, вероятность и т. Д. Третий тип скажет вам просто изучить то, что вы можете, чтобы начать и понять, как они работают логически и сосредоточиться больше о решении проблем.

Если вы решили быть 2-м или 3-м типом, вот несколько ресурсов, которые я считаю очень интуитивно понятными и полезными:
3 Blue 1 Brown
Академия Хана
Математика для машинного обучения

Пришло время нарисовать собственную диаграмму Венна, основанную на вашем роде. Я третий тип, и до сих пор мне удавалось преодолевать разрыв между технологиями и бизнесом. Вот так выглядит мой Венн :)

Мой ключевой фактор успеха заключался в том, чтобы быть очень хорошим в 1-2 навыках и хорошо разбираться во многих других (чем больше разнообразия, тем лучше, поскольку вы можете выступать перед несколькими аудиториями).