Портфельные проекты машинного обучения на 2019

Часто мы слышим: Первое впечатление - это последнее впечатление, и, возможно, этого утверждения достаточно, чтобы оправдать, насколько естественным является создание потрясающего портфолио кандидатов при подаче заявки на позицию в Data Science или точнее Машинное обучение. Технологии в области прогнозной аналитики развиваются как никогда раньше (кто ожидал, что Google превзойдет ReLU в этом году с помощью Swish, а затем выпустит 8 TensorFlow улучшение версии в течение года). С одной стороны, спрос на потенциальных кандидатов стремительно растет и, как ожидается, вырастет в три раза к 2020 году, а с другой стороны, цифровая эра увеличила кадровый резерв примерно на 650%.

Равновесие спроса и предложения уже несбалансировано в соответствии с текущими тенденциями и станет еще более конкурентоспособным в следующие 2–3 года. Так что либо мы тянемся, ожидая, пока рынок Data Science лопнет через пару лет, ЛИБО преобразовываем наше видение в действия, чтобы конкурировать с лучшими в мире. Либо припишите многолетний опыт, который требуется рекрутером при размещении вакансий, либо воспользуйтесь тем фактом, что в этой области еще нет отраслевого эталона для определения права кандидата. Если вы новичок в этой области (независимо от опыта в какой-либо другой отрасли) и не имеете такого многолетнего опыта, ПРИШЛО ВРЕМЯ, чтобы скрыть эти ловушки.

Портфолио кандидатов в любой сфере прогнозной аналитики или исследований НЕ так хорошо, как их образовательные степени (хотя это, безусловно, большой бонус) или сертификаты. прилагается, НО так же хорош, как и личные / профессиональные проекты, предпринимаемые для демонстрации готовых к работе навыков. Наборы данных Iris или Titanic очень хороши, чтобы спорить, изучая эти элементарные концепции, но когда дело доходит до резюме, наше шоу должно быть звездный. Ниже я отобрал пять потрясающих проектов, которые могут выделить нас из толпы и открыть двери для собеседований. Пора быть этим решительным зверем, чтобы покорить некоторые из этих красот в нашем собственном редакторе (не вкладывались в эти графические процессоры NVIDIA, чтобы просто расслабиться, поэтому давайте приведем их в действие) и продемонстрировать их в нашем резюме. Давайте пройдемся по этому списку:

Создание музыки и искусства с помощью Machine Intelligence:

Наша основная цель - создание песен, изображений, рисунков и других подобных материалов. Google Brain Team вместе с несколькими другими участниками уже подарили нам готовый к использованию пакет / библиотеку для этой цели - Magenta. Инструкции по установке для Python доступны прямо здесь, а исходный код доступен здесь. Пора дать жесткую борьбу профессиональным авторам песен и музыкантам, потому что наши алгоритмы будут намного лучше при создании музыки. Если вам нужно вдохновение по этому поводу, загляните на brain.fm (эти талантливые ребята создали целый фильм, так что, ребята, не можем ли мы хотя бы написать песню?). Вот вам очень хорошая статья с десятками примеров использования от команды Stanford Research, BachBot, FlowMachines и т. Д. все это, если у нас все еще нет нашего TensorFlow, импортированного в Editor, что ж, тогда нам нужно переоценить нашу любовь к машинному обучению.

2. Преобразование непарного изображения в изображение:

Вот еще один шанс быть этим волшебником во время интервью. Не стесняйтесь использовать PyTorch или TensorFlow для создания согласованных по циклу состязательных сетей для преобразования непарных изображений в изображения. Возможности бизнес-внедрения такого алгоритма огромны, и чтобы почувствовать, подумайте обо всем, что мы можем сделать с макетами корневой карты, наблюдением за безопасностью в плохую погоду и т. Д. Для начала пройдитесь по исследовательская статья Джун-Ян Чжу *, Тэсон Парк *, Филипп Изола , Алексей А. Эфрос в ICCV 2017. (* равные вклады). Не позволяйте никому копировать код PyTorch отсюда или код TensorFlow отсюда (шучу! Пожалуйста, аккредитируйте исследователей). Вот ссылка на весь репозиторий GitHub для справки, если требуется. [ Совет. Используйте TensorFlow, если используется система Windows ].

3. Глубокое вероятностное программирование:

Имея в арсенале достаточно современного глубокого обучения и навыков байесовского моделирования, мы можем использовать эту альфа-версию Bazooka для всех необходимых нам фейерверков. Разработано и используется в производстве Uber AI Labs для сложных математических рассуждений о темпах изменений. Это стохастическое вычисление, построенное на основе PyTorch (для автоматического дифференцирования), представляет собой генеративный рассказ о любых данных, сохраняя универсальность спецификации. Просматривая исходный код на GitHub, давайте подведем итоги того, что может делать этот язык:

4. Отслеживание объектов, счетчик посетителей и обнаружение текста:

Мы просто не можем просить большего, потому что Dr. Adrian Rosebrock предлагает еженедельно в своем блоге PyImageSearch даже слово УДИВИТЕЛЬНЫЙ звучит как недооценка. Он - известная легенда в сообществе ИИ, который проводит экстравагантные PyImageConf (не пропустите 26 августа 2018 г., если вы близки к Сан Франциско, Калифорния) каждый год, чтобы другие стойкие люди выходили на сцену и делились знаниями. Список его предложений включает Отслеживание объектов, Обнаружение значимости, Обнаружение текста , счетчик посетителей и многое-многое другое. И все его сообщения в блоге поставляются со свободно загружаемым кодом и объяснениями, и, кроме того, он лично взаимодействует с каждым человеком, который комментирует его сообщение с запросом, несмотря на его плотный график. Теперь вы, ребята, знаете, как некоторые из них публикуют классные проекты отслеживания объектов OpenCV в LinkedIn. Что же тогда нас сдерживает?

5. Преобразование голоса с непараллельными данными:

Что, если бы мы могли подражать голосу известной знаменитости или петь, как известный певец? Этот проект требует преобразовать чей-то голос в конкретный целевой голос. Это так называемая передача голосового стиля. Даби Ан и Кьюбьонг Пак работали над этим проектом, чтобы преобразовать чей-то голос в нашу голливудскую возлюбленную (поэтому многие из нас до сих пор любят набор данных Титаник) голос Кейт Уинслет. Они внедрили глубокие нейронные сети, чтобы добиться этого, и в качестве набора данных используются более чем 2 часа предложений аудиокниги, прочитанных Кейт Уинслет. Можем ли мы теперь использовать их архитектуру и код их преобразования голоса многие в один, чтобы заставить Кейт Уинслет вслух прочитать рекрутерам детали нашего резюме? Если это звучит круто, возможно, вам стоит отметить в своем календаре эти выходные как Занято!

Составление расписания и посещение собеседований - это обременительный процесс, через который никто из нас не предпочитает проходить, но, опять же, время от времени это необходимо, чтобы сделать нашу жизнь лучше (по крайней мере, в течение первых нескольких недель). Я надеюсь, что учащиеся, искренне заинтересованные в области машинного обучения и искусственного интеллекта, попробуют эти классные проекты, и я хотел бы послушать ваши истории (пожалуйста, используйте раздел Комментарии ниже), если эти проекты помогут вам в чем-либо способ быть выделенным. Кроме того, не стесняйтесь обращаться ко мне за чем-нибудь еще, с чем я могу помочь. Удачи с интервью!

Писатель имеет диплом по финансам со степенью магистра прикладной статистики. Он также имеет диплом о высшем образовании в области когнитивных вычислений. Профессионально он имеет опыт в области прогнозной аналитики и бизнес-аналитики и ранее работал с такими организациями, как Dell и VMware. Он обучал профессионалов в предыдущих компаниях в своей области и продолжает способствовать развитию сообщества. В настоящее время он работает консультантом по когнитивным вычислениям.

Портфельные проекты машинного обучения на 2019–2020 годы:

Вопросы по теме