Изучение этих ошибок поможет вам не тратить время на самообучение анализу данных.

Если вы когда-нибудь пытались чему-то научиться самостоятельно, вы знаете, что это часто занимает у вас неизмеримо много времени. Это особенно верно, когда дело доходит до обучения анализу данных.

От программирования до математики и визуализации данных анализ данных заключает в себе три очень разных навыка, которые требуют различных методов обучения. Не только это, но может быть легко засосать в кроличью нору учебных пособий Youtube и статей по анализу данных, которые могут привести к тому, что вы потратите на обучение даже больше времени, чем вы изначально ожидали.

При изучении анализа данных я совершил немало ошибок, основные из которых я перечислил ниже, а также несколько практических способов их избежать, которые вы можете начать применять немедленно. Изучение анализа данных не должно быть долгим процессом, если вы знаете, когда взяться за перо (так сказать), когда использовать уже известные вам инструменты вместо изучения новых, когда сосредоточиться на изучении только самого навыки, которые вам нужны, и когда нужно твердо стоять на своем и закончить свою цель обучения анализу данных.

Добавляйте в существующий проект каждый раз, когда узнаете что-то новое

Ошибка: сидеть в учебнике по программированию-чистилище, думая, что вы знаете, как кодировать, но на самом деле не знаете, как кодировать.

Исправление.Самый простой способ избежать траты времени на чистилище руководств по программированию — добавлять новые элементы в существующий проект каждый раз, когда вы изучаете что-то новое.

Прежде чем изучать разработку программного обеспечения в университете, я много раз пытался научиться программировать, следуя онлайн-руководствам от Codecademy и Youtube. К сожалению, я тратил все свое время только на уроки и никогда не брал перо на бумаге (так сказать) и не создавал что-то, используя то, что я узнал. Я потратил много времени, не применяя то, что узнал теоретически, что привело к отсутствию ощутимых результатов.

Изучение аспекта кодирования анализа данных, вероятно, является наиболее практической частью, которая требует немедленного внедрения того, что вы практиковали, с помощью учебного пособия. Например, написав всю программу анализа, вы можете посмотреть обучающее видео о том, как сгруппировать код в функции. Затем вы должны перейти к коду вашего проекта и создать функции, которые организуют и упрощают ваш код.

Эта практика не только позволяет вам учиться быстрее, но и позволяет быстрее завершать проекты. Например, вы можете изучать анализ данных только для завершения одного проекта. Вместо того, чтобы ждать начала работы над своим проектом, пока вы не изучите все, что нужно знать о программировании на Python, вы можете начать оттачивать свой проект по мере того, как вы изучаете различные навыки или приемы.

Например, мне нужно изучить некоторые аспекты анализа данных, чтобы завершить некоторые исследования для студентов, которые я провожу. Однако из-за того, что у меня есть крайний срок для завершения исследовательской работы, и поскольку мне нужно в конечном итоге получить высшее образование, мне нужно работать быстро, чтобы понять, что мне нужно добавить в мой код, а затем немедленно внедрить это.

Помните: вам не нужна большая глубина знаний, чтобы выполнить анализ данных, вам просто нужна широта знаний, чтобы понять, когда вам нужно что-то делать, а когда нет.

Используйте Excel для очистки данных (и все, что вы можете придумать)

Ошибка: я думаю, что мне нужно использовать специальный инструмент для завершения очистки данных, что означает, что я трачу меньше времени на очистку и больше времени на обучение.

Исправление. Используйте Excel как можно чаще для выполнения любых задач по анализу данных.

Социальные сети создают впечатление, что вам нужно быть волшебником с множеством языков программирования, инструментов и платформ, чтобы стать аналитиком данных. Фактически, многие аналитики данных прекрасно справляются со своей работой, используя только Excel. Я не уверен, когда Excel стал неактуальным, но я здесь, чтобы сказать, что вы должны использовать Excel для очистки всех ваших данных и вообще всего, что вы можете придумать.

Excel по-прежнему остается невероятно мощным инструментом для работы с данными и одним из самых простых в освоении благодаря множеству онлайн-ресурсов.

Когда я впервые изучал анализ данных, я потратил столько времени на изучение всех этих новых инструментов, приемов кодирования и взломов баз данных для работы с моими данными. Вместо этого я мог бы сразу же начать обрабатывать чистые данные и даже целые анализы, если бы только начал использовать Excel с самого начала.

Философия, которую я хочу передать вам, заключается в том, что если вы знаете способ сделать что-то, и он работает, продолжайте его использовать. Да, в вашей карьере может наступить момент, когда вам нужно будет выйти за рамки использования Excel, но сейчас не тратьте время на изучение того, как проводить анализ данных — вместо этого выполняйте больше анализа данных с помощью инструментов, которые вы уже знаете!

Сосредоточьтесь на линейной алгебре, вероятности и статистике

Ошибка: я полагал, что мне нужно знать многомерное исчисление и дискретную математику, чтобы проводить анализ данных.

Исправление. Изучайте только те математические операции, которые необходимы для выполнения анализа — скорее всего, вы уже знаете все, что вам нужно.

Одно из самых больших заблуждений в отношении самостоятельного обучения анализу данных заключается в том, что вам необходимо знать продвинутые формы математики. Здесь важна терминология. Некоторые люди либо путают, либо намеренно заменяют термины «наука о данных» термином «анализ данных», а затем основывают свое описание дисциплины на науке о данных. На самом деле они совершенно разные. Если вы хотите заниматься наукой о данных, то да, вам нужно знать продвинутые формы математики. Однако, если вы хотите провести анализ данных, вы можете обойтись гораздо более простыми формами математики.

Вы можете выполнить большинство задач анализа данных, используя линейную алгебру, вероятность и статистику (с потенциалом для некоторых вычислений с одной переменной).

Сосредоточившись на математике, которая вам действительно нужна для завершения анализа, вы сэкономите время, которое в противном случае было бы потрачено впустую на самостоятельное изучение сложных математических понятий, которые вы, возможно, никогда не используете. Лучший способ сделать это — просмотреть все математические требования к проекту и изучить только те, которых вам не хватает. Это сократит время обучения с потенциально нескольких месяцев до пары недель. Кроме того, это позволяет вам сосредоточиться на широте ваших знаний, а не на их глубине. Помните, широту знаний можно быстро освоить и сразу применить. Глубина знаний может занять месяцы или годы, чтобы развиться.

Составьте план обучения с указанием срока, который фокусируется на правильной цели.

Ошибка: относиться к учебной части как к бесконечной временной шкале вместо того, чтобы устанавливать жесткие сроки, дающие конкретные результаты.

Исправление. Создайте план обучения с жесткими сроками, который фокусируется на достижении конкретной цели или краткого списка задач.

Помните, когда вы учились в школе, и в начале семестра учитель давал вам учебный план, содержащий учебные цели курса и все, что вам нужно было изучить для достижения этих целей? Это были бесценные документы, которые должны были вдохновить нас на создание наших планов обучения анализу данных.

Вам нужно создать свой собственный учебный план с жесткими сроками и четкой целью. Вы не хотите увлечься своим обучением только для того, чтобы через три года осознать, что вы не совсем уверены в том, что вы только что узнали, и почему это может быть или не быть актуальным.

Например, я буду работать над каким-то студенческим исследованием, которое потребует от меня проведения анализа данных. Анализ данных — это лишь малая часть проекта, а это значит, что мне нужно составить график обучения тем аспектам, которым мне нужно заниматься самостоятельно, с учетом всех остальных частей проекта, которые мне необходимо выполнить. . Другими словами, я не могу тратить все время на изучение концепций анализа данных, потому что есть целый список других вещей, которые нужно сделать. Кроме того, в плане обучения должно быть несколько четких целей, которые после достижения остаются позади, чтобы я мог начать применять навыки в своем проекте. Как я уже говорил ранее, я не хочу спускаться в кроличью нору обучения только для того, чтобы понять, что то, что я только что узнал, не обязательно было хорошим использованием моего времени.

Хитрость заключается в том, чтобы создать план обучения с жесткими сроками и тремя четкими целями. Эти цели должны относиться либо к практическим навыкам, либо к завершению проекта, либо к работе по анализу данных. Цели должны быть такими, чтобы после того, как вы завершили некоторое обучение, вы могли оценить, достигли ли вы цели или вам нужно продолжить обучение. Цель состоит в том, чтобы дать однозначное «да», когда вас спросят, сможете ли вы выполнить какую-либо из задач в сценарии, похожем на тест.

Этот метод не только удерживает вас в процессе обучения, но и избавляет вас от отвлечения внимания, отклонения от курса, изучения неправильных вещей или многолетних усилий, чтобы закончить то, что можно было бы сделать всего за несколько недель.

Подпишитесь, чтобы получать мои истории прямо на ваш почтовый ящик: Story Subscription

Пожалуйста, станьте участником, чтобы получить неограниченный доступ к Medium по моей реферальной ссылке (я буду получать небольшую комиссию без дополнительных затрат для вас): Medium Membership

Поддержите мое письмо, пожертвовав средства на создание большего количества историй, подобных этой: Пожертвовать