Основной обзор и прочее ;)

Прежде чем начать говорить о том, что такое машинное обучение, его приложения и все такое прочее, давайте поговорим о предпосылках машинного обучения. В отличие от большинства других ИТ-работ, инженер ML должен не только иметь навыки кодирования, но и хорошо разбираться в математике. Без математики изучение машинного обучения похоже на саботаж плана, даже не начав его. Но с другой стороны, чтобы начать наше путешествие по ML, нам не нужно быть большим математиком или кем-то в этом роде, для начала будет достаточно некоторых базовых знаний. Итак, давайте посмотрим, какие предварительные условия:

  1. Основная статистика
  2. Основное исчисление
  3. Базовая линейная алгебра
  4. Базовый Python

Давайте проверим, поняли ли мы наши основы или нет.

  1. Матричное умножение -›

2. Вычислить производную -›

3. Подсчитайте количество букв, слов :

Напишите программу на Python для подсчета букв и слов в предложении с помощью функции (избегайте использования каких-либо предопределенных функций)

Решение :

Что такое машинное обучение?

Машинное обучение описывается как множество вещей, таких как следующий естественный шаг искусственного интеллекта, применение статистики, некоторые продвинутые алгоритмы и т. д. Но на самом деле ML — это все. Как и AI ML, он занимается пониманием, обработкой данных и разумным ответом на их основе, как и статистика, он оценивает данные с использованием различных расширенных формул, как и алгоритм, он предоставляет o/p на основе некоторых данных i/p.

Машинное обучение против традиционного программирования

Возьмем пример,

В традиционном программировании, чтобы отличить что-то или кого-то, скажем, чтобы распознать меня с помощью традиционного программирования, программе нужно искать очки, черные волосы и другие различимые вещи, которые должны быть упомянуты должным образом (жестко закодированы в программе).

тогда как в ML все, что нам нужно сделать, это передать многочисленные изображения нашего лица, и оно автоматически начнет узнавать меня с помощью различных алгоритмов.

Почему сейчас ML возможен, а десять лет назад этого не было?

Для работы с моделями машинного обучения нам нужно много данных, а для работы с ними нужны высокие вычислительные способности. Но если мы вернемся на десятилетие или два назад, мы вряд ли найдем какой-либо надлежащий объем данных, которые можно было бы использовать, а также вычислительная мощность в те дни была намного ниже, чем сейчас.

Но теперь почти все оцифровано, создавая огромное количество данных, которые можно использовать, а с повышением вычислительной мощности в настоящее время намного проще работать с машинным обучением.

Применение машинного обучения:

Использование машинного обучения можно увидеть повсюду: в спорте, здравоохранении, образовании, на фондовом рынке и во многих других областях. На самом деле очень трудно найти какую-либо область, в которой не было бы ни малейшего намека на М.Л.

Машинное обучение в основном имеет два аспекта:

  1. Искусственный интеллект
  2. Наука о данных

Что такое искусственный интеллект? Где выросло машинное обучение помимо ИИ?

Искусственный интеллект обычно подразумевается нечеловеческим агентом (компьютерами), который может имитировать человеческие способы мышления и действия в реальном мире. Но главное различие между ИИ и МО заключается в том, что вместо того, чтобы действовать как люди, МО имеет более широкий смысл, который можно описать как выполнение автономных действий, которые могут быть или не быть такими же, как у людей.

Основные загадки искусственного интеллекта:

  1. Интеллектуальные агенты имеют ограниченные ресурсы.
  2. Вычисления локальны, но проблемы имеют глобальные ограничения.
  3. Логика дедуктивна, но многие проблемы — нет.
  4. решение проблем, рассуждения и обучение сложны, но объяснение и обоснование еще более сложны.

Основные характеристики задач ИИ:

  1. Знания часто приходят постепенно.
  2. Проблемы демонстрируют повторяющиеся модели.
  3. Проблемы имеют несколько уровней детализации.
  4. Многие задачи не поддаются вычислительному решению.
  5. Мир динамичен, но Знание о мире статично.
  6. Мир открыт, но знания ограничены.

ИИ как управление НЕОПРЕДЕЛЕННОСТЬЮ

AI = Что делать, если не знаешь, что делать?

Причины неопределенности:

  1. Пределы датчика
  2. противники
  3. Стохастическая среда
  4. Лень
  5. Невежество

Пример проблем ИИ:

  1. Отвечая на опасные вопросы.
  2. Настройка размеров для подвала нового дома.
  3. Завязывание шнурков
  4. Выбор маршрута к новому пункту назначения.
  5. Осмысление новостной передачи.
  6. Создаем роботов, которые ходят по воде! ;)
  7. Изготовление цветочного горшка, который можно использовать как чашку для питья ;)
  8. Решить, является ли новое животное птицей.

Прежде чем двигаться дальше, мы должны сначала узнать о правиле Байеса. Многие из нас уже знают, что это такое. Итак, я вкратце коснусь этой темы. ХОРОШО! поэтому возникает первый вопрос: почему я вдруг говорю о правиле Байеса? Итак, для начала теорема Байеса является одним из основополагающих элементов искусственного интеллекта, а также важной концепцией машинного обучения. Перед тем, как мы начнем понимать теорему Байеса, необходимо иметь некоторые базовые сведения о статистике, которые, я думаю, мы все знаем.

Правило Байеса:

где А и В — события. И Р(В) ≠ 0

  • P(A | B) — это условная вероятность: вероятность того, что событие A произойдет при условии, что B истинно. Ее также называют апостериорной вероятностью A, заданной B.
  • P(B | A) также является условной вероятностью: вероятностью возникновения события B при условии, что A истинно, поскольку P(B | A) = L(A |B)
  • P(A) и P(B) — вероятности наблюдения A и B соответственно без какого-либо заданного условия; они известны как предельная вероятность или априорная вероятность.
  • A и B должны быть разными событиями.

Что такое наука о данных?

Наука о данных — это область исследования, которая работает с огромными объемами данных с использованием современных инструментов и методов для поиска невидимых закономерностей, получения значимой информации и принятия бизнес-решений. Наука о данных использует сложные алгоритмы машинного обучения для построения прогностических моделей.

Кто такой специалист по данным?

Базовые навыки специалиста по обработке и анализу данных:

Основная экспертиза:

— Знает, какие вопросы задавать

- может хорошо интерпретировать данные

— понимает структуру данных

— Специалисты по данным часто работают в командах

Задачи, решаемые наукой о данных:

  1. Рекомендация фильмов (на таких сайтах, как Netflix, Amazon Prime)
  2. Социальные сети (Facebook, Instagram и многие другие)
  3. Веб-приложения (Tinder, Uber и т. д.)
  4. Биоинформатика (Понимание генных данных)
  5. Городское планирование
  6. Астрофизики (анализ стартовых скоплений и многое другое)
  7. Здравоохранение
  8. Виды спорта

Индукция и дедукция:

Индукция – при заданной причине и следствии выведите правило.

Вывод-› Учитывая правило и причину, выведите следствие.

Похищение – при заданном правиле и следствии похищайте причину.

Машинное обучение в основном представляет собой индукцию, потому что в машинном обучении, учитывая данные о причине и следствии, мы пытаемся создать правильное отношение/правило, которое используется для прогнозирования неизвестного эффекта для другой причины.

Что такое машинное обучение?

Использование и разработка компьютерных систем, способных обучаться и адаптироваться без явных инструкций, данных им, с использованием алгоритмов и статистических моделей для анализа и получения выводов на основе закономерностей в данных.

Типы машинного обучения:

В основном существует 3 типа алгоритмов ML-›

  1. Контролируемое машинное обучение
  2. Неконтролируемое машинное обучение
  3. Повторное обучение

Обучение с учителем . Обучение с учителем — это тип машинного обучения, при котором машины обучаются с использованием хорошо "помеченных" обучающих данных, и на основе этих данных машины прогнозируют результат.

Обучение без учителя. Обучение без учителя – это тип машинного обучения, при котором модели обучаются с использованием немаркированного набора данных и могут работать с этими данными без какого-либо контроля.

Обучение с подкреплением . Обучение с подкреплением работает на основе процесса, основанного на обратной связи, в котором агент ИИ (программный компонент) автоматически исследует свое окружение, нанося удары и отслеживая, предпринимая действия, учась на опыте и повышение его производительности.

В этом блоге я попытался дать базовый обзор машинного обучения. В следующем блоге я расскажу об исследовании выживания на Титанике, а после этого углублюсь в теорию и практику.