Окончательная дорожная карта для студентов 1-го и начала 2-го курса!

Привет народ! Этот блог о том, как бы я изучил науку о данных и смежные области, если бы мне пришлось начинать все сначала. Пожалуйста, следуйте этому руководству, если вы учитесь на первом или втором курсе и хотите получить глубокое понимание сквозного проектирования приложений данных в любой технологической компании, чтобы сделать блестящую карьеру в этой области! Я гарантирую, что если вы пойдете по этому пути, вы будете обладать знаниями человека с опытом работы в этой отрасли не менее 3 лет.

Отказ от ответственности-

  1. Это НЕ бесплатное руководство. По моим оценкам, следование всей дорожной карте обойдется вам примерно в 60 000 индийских рупий (без учета налога на товары и услуги). Однако, поверьте мне, это вложение будет намного лучше, чем так называемое сертификационное обучение в коучинговом институте, которое будет стоить вам столько же, если не больше.
  2. Это НЕ гарантированный способ получить работу 30–40 LPA сразу после колледжа. Могу заверить только в глубоких знаниях, но не в такой зарплате от этого курса. Если вы хотите этого, не стесняйтесь идти по пути конкурентного программирования и открытого исходного кода.
  3. Я никоим образом не связан ни с одним из этих курсов. Я всего лишь студент и не знаю ни институтов, ни их основателей. 🙂

Если вы все еще заинтересованы, читайте дальше и следуйте порядку, в котором изложена дорожная карта.

Питон-

Я хотел бы отметить 3 ресурса. Вы можете использовать любой или все в зависимости от ваших временных ограничений.

  1. Python для всех — Чарльз Северанс на Coursera-Честно говоря, это первый курс для 60–70% разработчиков Python. Вас будет учить удивительно крутой профессор из Мичиганского университета.
  2. Плейлист Python от Dhaval Patel-Вы будете учиться у инженера-программиста, который работал с Nvidia и Bloomberg. Рассмотрите возможность подписки на его канал, если вы хотите попасть в эту область.
  3. Плейлист Python от Tim-Молодой инженер-программист, с которым большинство из вас может найти общий язык. У него есть 3 плейлиста - начальный, средний и продвинутый. Вы также можете рассмотреть возможность создания нескольких крутых проектов Python на его канале. Стоит подписаться!

P.S. Если у вас есть время, подумайте о том, чтобы проверить фреймворки Flask/Django от Тима или профессора Чарльза Северанса (более теоретически). Но вы можете пропустить это сейчас.

SQL-

Узнайте об этом на freeCodeCamp или Mosh. Главное здесь — практика. Сделайте это из Leetcode, Hackerrank и SQLZoo.

Структуры данных и алгоритмы-

Может показаться нелогичным, но я предлагаю не делать этого в Python. Выберите C++ или Java и практикуйте 1-2 Leetcode от простого до среднего ежедневно на тот случай, если вам придется вернуться к традиционной работе по разработке программного обеспечения. Поверьте мне, для этого вы получите огромное количество ресурсов на YouTube. 😂

Инжиниринг данных-

Да, вы не ослышались! У вас будет лучшая основа для Data Science и ML, если вы начнете с Data Engineering. TrendyTech — хороший курс в этой области. По правде говоря, качественных практических курсов в этой области не так уж и много.

Примечание. Инжиниринг данных — быстро развивающаяся область. Если вам нравится курс, ваше путешествие заканчивается здесь (ну, по крайней мере, до колледжа), и нет необходимости читать дальше. Завершите курс, пройдите как можно больше стажировок. Квалифицированным дата-инженерам платят столько же, если не больше, чем специалистам по данным, и квалифицированных специалистов в этой области очень мало, а спрос постоянно растет. Кроме того, эта область больше подходит для первокурсников со степенью бакалавра, чем для машинного обучения. Так что путь довольно радужный.

Наука о данных и машинное обучение-

Теперь, вот пикантная часть поста. Чтобы плюнуть на факты, Курс AppliedAI — лучший курс в этой области. Инструктор, сэр Срикант Верма (с богатым опытом работы в Amazon и Yahoo в роли машинного обучения), является лучшим инструктором по машинному обучению в Индии, которого я видел, и его навыки преподавания находятся на одном уровне (если нет, то в разы лучше, XD) с инструкторами в Стэнфорде, Массачусетском технологическом институте и т. д. Он заставит вас влюбиться в машинное обучение благодаря идеальному сочетанию теории и практического характера его лекций.

Примечание-

  1. В курсе 30 заданий, которые довольно крепкие орешки. Удачи с этим.
  2. Вы получите несколько живых сессий вместе с лекциями курса. На данный момент вы можете игнорировать те, которые предназначены для опытных людей, например, тех, кто занимается проектированием систем машинного обучения и т. д. Будут некоторые пошаговые руководства по коду и вопросы интервью, такие как сеансы, которые вы должны посмотреть.
  3. К концу курса у вас будет хорошее портфолио проектов. Рассмотрите возможность развертывания проектов с использованием методов, обсуждаемых Шрикантом Сэром в живых видео (Flask, Streamlit, Sagemaker, KubeFlow и т. д.). Это мне очень помогло.
  4. В iNeuron также есть курс по науке о данных. Он больше ориентирован на программирование приложений, а не на теорию. Это еще один вариант для вас.
  5. Этот курс охватывает 70 процентов науки о данных в реальном мире. В остальном читайте дальше.

Практическая наука о данных-

Попробуйте пройти множество курсов от LogikBot, чтобы получить опыт того, какая наука о данных на самом деле делается в реальном мире. Чтение электронных книг Джейсона Браунли — еще один фантастический способ сделать то же самое. В основном понимание аспектов кодирования.

Заключение-

Вау! Это много времени. Я бы оценил примерно в 2 года для относительно способного ученика. Если у вас все еще есть время, подумайте о том, чтобы изучить Flask/Django и посмотреть видео о проектировании систем машинного обучения от AppliedAI, особенно если вы стремитесь стать инженером по машинному обучению.

Если вы завершили дорожную карту, находитесь в пути или планируете начать, не стесняйтесь подключаться! Пожалуйста, задавайте вопросы в разделе комментариев. И, наконец, будьте щедры на аплодисменты и следите за мной еще!