Сравнение и 15 реальных вариантов использования.

Я начал свою карьеру в области программирования .NET, используя C++ и C#; переход к науке о данных был плавным и легким. Во всяком случае, ничто не может подготовить вас к профессии специалиста по данным, кроме как начать работу в качестве инженера-программиста.

В этом посте я сосредоточусь только на машинном обучении, глубоком обучении и обработке естественного языка, трех областях искусственного интеллекта, чтобы продемонстрировать, как эти роли сходятся вместе с их различиями.

Машинное обучение

Инженер-программист и специалист по данным используют машинное обучение в своей профессиональной деятельности, но используют его по-разному. Машинное обучение — это область искусственного интеллекта, которая фокусируется на создании алгоритмов, которые могут учиться и делать прогнозы на основе данных.

Инженер-программист может использовать машинное обучение для создания моделей прогнозирования таких вещей, как ошибки кода или отток клиентов. Они также могут использовать его для разработки систем рекомендаций или автоматизации таких действий, как обнаружение уязвимостей безопасности в коде. Как правило, инженер-программист будет использовать машинное обучение для решения низкоуровневых требований к реализации в программном обеспечении.

С другой стороны, специалист по данным с большей вероятностью применит машинное обучение для исследовательских целей. Они могут быть направлены на выявление скрытых закономерностей в наборах данных или построение моделей, которые могут использоваться лицами, принимающими решения внутри организации. Специалисты по данным часто имеют дело с большими и более сложными наборами данных, чем те, с которыми, вероятно, не так часто сталкиваются разработчики программного обеспечения; поэтому их реализации машинного обучения, как правило, шире и меньше сосредоточены на одной конкретной проблемной области.

Вот несколько реальных приложений этих двух ролей:

— Используя историю просмотров и покупок клиента, инженер-программист интернет-магазина может применить машинное обучение, чтобы оценить вероятность того, что потребитель совершит покупку.

— Машинное обучение может использоваться специалистом по данным в сфере здравоохранения, чтобы определить, будут ли у пациентов благоприятные результаты от определенных методов лечения.

— Инженер-программист, работающий в финансовом учреждении, может использовать машинное обучение для выявления случаев мошенничества или отмывания денег.

— Специалист по данным, работающий в государственном учреждении, может использовать машинное обучение для поиска закономерностей на спутниковых снимках, которые могут указывать на наличие незаконных действий, таких как маршруты распространения наркотиков или торговля людьми.

— Интернет-магазин может воспользоваться услугами экспертов обоих типов: инженеры-программисты будут работать над улучшением таких показателей, как коэффициент конверсии и средняя стоимость заказа, а специалисты по обработке и анализу данных будут анализировать такие данные, как демографические данные клиентов и их покупательские привычки, чтобы лучше адаптировать свои рекламные кампании.

Глубокое обучение

Глубокое обучение может использоваться как инженерами-программистами, так и специалистами по обработке и анализу данных, но эти две области подходят к нему совершенно по-разному.

Обучение на основе данных с использованием алгоритмов в стиле нейронных сетей известно как глубокое обучение, ветвь машинного обучения. Распознавание образов, извлечение признаков и классификация — это лишь некоторые из многих приложений для моделей глубокого обучения.

Инженеры-программисты часто используют глубокое обучение для создания программ, которые со временем могут учиться и становиться лучше. Инженер-программист может использовать глубокое обучение для разработки системы распознавания лиц, которая со временем улучшает свою производительность, поскольку она подвергается воздействию большего количества примеров человеческих лиц на изображениях. Существует вероятность того, что специалисты по данным могут применять возможности глубокого обучения для повышения точности своих прогнозов. В отличие от инженеров-программистов, которые полагаются на уже существующие библиотеки глубокого обучения, специалисты по данным часто тратят много времени на изучение того, как обучать определенные нейронные сети для своих данных и целей. Вот пять реальных примеров того, как инженеры-программисты и специалисты по данным используют глубокое обучение:

— Инженер-программист может использовать глубокое обучение для создания системы, которая со временем сможет самосовершенствоваться за счет включения новых данных и тонкой настройки существующих алгоритмов.

— Исследователь данных может использовать статьи о финансовых новостях в качестве входных данных для модели глубокого обучения, чтобы более точно прогнозировать цены на акции.

— Инженер-программист мог бы спроектировать беспилотный автомобиль, который становится безопаснее на дороге, чем больше он ездит.

— Исследователь данных, обучающий модели для распознавания объектов на спутниковых фотографиях, может интенсивно изучать, как различные типы нейронных сетей (например, сверточные нейронные сети или CNN) работают с их уникальным набором данных.

— Юристы, работающие с вариантами использования контрактов, также могут извлечь выгоду из недавних улучшений в моделировании последовательностей, таких как алгоритм Google BERT, который может создавать сложные результаты понимания языка.

Обработка естественного языка (NLP)

Хотя НЛП полезно как инженеру-программисту, так и специалисту по данным, эти два специалиста подходят к нему совершенно по-разному.

Разработчик НЛП может создать чат-бота или другой интерфейс для взаимодействия людей с машинами. Одним из таких подходов является создание алгоритмов, которые могут обрабатывать и реагировать на ввод на естественном языке. Кроме того, инженер-программист может использовать обработку естественного языка для улучшения результатов поиска на веб-сайте или для автоматизации таких операций, как разработка кода.

С другой стороны, специалист по данным с большей вероятностью применит обработку естественного языка для текстовой аналитики. Создание моделей, которые могут извлекать информацию из неструктурированных текстовых данных, классифицировать документы по темам или выявлять закономерности в публикациях в социальных сетях, — все это примеры того, как это можно сделать. Специалисты по данным могут также использовать методы обработки естественного языка, такие как анализ настроений, чтобы лучше понимать отзывы потребителей и анализировать огромные объемы текстовой информации для научных исследований.

Вот пять примеров того, как инженеры-программисты и специалисты по данным используют НЛП в реальном мире.

— Инженер-программист может использовать обработку естественного языка для создания чат-бота, который может интерпретировать пользовательский ввод и давать соответствующие ответы.

— Исследователь данных может использовать обработку естественного языка для создания модели, которая может назначать темы документам.

— Инженер-программист может использовать НЛП для уточнения результатов поисковой системы, анализируя запрос пользователя и предоставляя результаты, которые лучше всего ему соответствуют.

— Специалисты по данным могут использовать обработку естественного языка (NLP) для анализа настроений, чтобы узнать больше о том, как клиенты относятся к определенной услуге, модели или продукту.

— Инженер-программист может использовать обработку естественного языка для автоматизации создания кода путем интерпретации описаний необходимых функций, написанных на естественном языке, и создания соответствующего кода.

Прощальные мысли

Пожалуйста, дайте мне знать, если у вас есть какие-либо предложения по изменению этого поста или идеи по расширению области темы.

Если вам нравится читать такие истории и вы хотите поддержать меня как писателя, подумайте о том, чтобы зарегистрироваться и стать участником Medium. Это 5 долларов в месяц, что даст вам неограниченный доступ ко всем историям на Medium. Если вы зарегистрируетесь по моей ссылке, я получу небольшую комиссию без каких-либо дополнительных затрат для вас.



Кроме того, вот мой информационный бюллетень; Я надеюсь, что вы любезно рассмотрите возможность подписки.



Кроме того, я написал следующие посты, которые могут быть вам интересны:

Попробуйте прочитать эти два поста:





Анил Тильбе