Что такое машинное обучение?

Как мы знаем, обучение — это процесс, с помощью которого мы улучшаем наши знания и производительность на основе опыта. Точно так же машинное обучение связано с компьютерными программами, которые автоматически улучшают свою производительность благодаря опыту.

Другими словами, машинное обучение — это ветвь искусственного интеллекта, которая предоставляет компьютерной системе возможность постепенно обучаться и повышать свою производительность при выполнении различных задач без явного программирования для выполнения всех задач.

Машинное обучение основано на алгоритмах, которые могут учиться на данных, не полагаясь на программирование на основе правил.

Объяснение машинного обучения

Так как же работает машинное обучение?

В машинном обучении мы явно не программируем машины о том, как решить конкретную проблему. Вместо этого мы даем машине возможности, чтобы она могла понять проблему и попытаться решить ее самостоятельно.

Что нам нужно для машинного обучения?

Для правильной работы любого алгоритма машинного обучения нам нужны четыре вещи:

1.Данные: входные данные, предоставляемые алгоритму машинного обучения.

2.Модель: алгоритм машинного обучения, который мы собираемся построить

3. Целевая функция: измеряет, насколько ваш прогнозируемый результат близок к фактическому.

4. Алгоритм оптимизации: цикл испытаний

Типы машинного обучения

В зависимости от того, как происходит процесс обучения для машины, машинное обучение подразделяется на 3 основные категории.

1. Контролируемое обучение

2. Неконтролируемое обучение

3. Обучение с подкреплением

так что теперь мы подробно разберем эти три типа ML.

1.Обучение с учителем:

Давайте разберем контролируемое обучение с помощью картинки

Предположим, что на картинке выше вы — мальчик, а имя робота/машины — Голу.

Теперь давайте разберем контролируемое обучение со следующих точек зрения:

1.Данные: здесь, на этой картинке, вы держите несколько изображений фруктов, это ваши данные.

2.Модель: Ваш друг Голу - наша модель. Технически модель может быть любой. Это так же просто, как алгоритм, функция или уравнение регрессии.

3. Целевая функция: это то, что вычисляет, насколько результат Голу близок к фактическому результату.

4. Алгоритм оптимизации: после того, как вы несколько раз поиграли в эту игру, вы решили обновить процессор, оперативную память и датчик изображения для Golu, чтобы он мог видеть изображения более четко и благодаря более быстрому процессору и оперативной памяти мог быстрее обрабатывать эти изображения. Давайте рассмотрим эти серии шагов как алгоритмы, и теперь это наш алгоритм оптимизации.

Теперь вопрос: почему это называется обучением с учителем?

Ну это и по самой картинке понятно. Вы показываете изображения Golu, а проверка, в свою очередь, дает ответ. Если он угадал правильно, вы ответили «да», в противном случае вы ответили «нет». Короче говоря, вы контролируете Голу, чтобы правильно идентифицировать фрукт, который показан на изображении, и поэтому имя контролируется.

Теперь у нас есть два типа обучения под наблюдением:

  1. Регрессия
  2. Классификация

Регрессионный анализ:

Регрессионный анализ — это статистический метод моделирования связи между зависимой (целевой) и независимой (предиктор) переменными с одной или несколькими независимыми переменными. В частности, регрессионный анализ помогает нам понять, как значение зависимой переменной изменяется в соответствии с независимой переменной, когда другие независимые переменные остаются фиксированными. Он прогнозирует непрерывные/реальные значения, такие как температура, возраст, зарплата, цена и т. д.

Мы можем понять концепцию регрессионного анализа, используя следующий пример:

Пример: предположим, что есть маркетинговая компания A, которая каждый год делает различную рекламу и получает от этого продажи. В приведенном ниже списке показана реклама, сделанная компанией за последние 5 лет, и соответствующие продажи.

Теперь компания хочет сделать рекламу на 200 долларов в 2019 году и хочет узнать прогноз продаж на этот год. Поэтому для решения таких задач прогнозирования в машинном обучении нам нужен регрессионный анализ.

Типы регрессии

Существуют различные типы регрессий, которые используются в науке о данных и машинном обучении. Каждый тип имеет свое значение в разных сценариях, но по сути все методы регрессии анализируют влияние независимой переменной на зависимые переменные.

  • Линейная регрессия
  • Логистическая регрессия
  • Полиномиальная регрессия
  • Регрессия опорных векторов
  • Регрессия дерева решений
  • Регрессия случайного леса
  • Регрессия хребта
  • Лассо-регрессия

Классификация анализа:

Алгоритм классификации — это метод контролируемого обучения, который используется для определения категории новых наблюдений на основе обучающих данных. В классификации программа учится на данном наборе данных или наблюдениях, а затем классифицирует новое наблюдение по ряду классов или групп. Например, Да или Нет, 0 или 1, Спам или Не спам, кошка или собака и т. д.. Классы могут называться целями/метками или категориями.

В отличие от регрессии, выходная переменная классификации представляет собой категорию, а не значение, например «зеленый или синий», «фрукт или животное» и т. д. Поскольку алгоритм классификации является методом контролируемого обучения, следовательно, он принимает помеченные входные данные, которые означает, что он содержит ввод с соответствующим выводом.

Лучшим примером алгоритма классификации машинного обучения является детектор почтового спама.

Основная цель алгоритма классификации — определить категорию данного набора данных, и эти алгоритмы в основном используются для прогнозирования выходных данных для категорийных данных.

Алгоритмы классификации можно лучше понять, используя приведенную ниже диаграмму. На приведенной ниже диаграмме есть два класса, класс A и класс B. Эти классы имеют функции, которые похожи друг на друга и отличаются от других классов.

Алгоритм, реализующий классификацию набора данных, известен как классификатор. Существует два типа классификаций:

  • Двоичный классификатор. Если задача классификации имеет только два возможных результата, она называется двоичным классификатором.
    Примеры: ДА или НЕТ, МУЖСКОЙ или ЖЕНСКИЙ, СПАМ или НЕ СПАМ, КОШКА или СОБАКА и т. д.
  • Мультиклассовый классификатор. Если задача классификации имеет более двух результатов, она называется мультиклассовым классификатором.
    Пример: классификация типов сельскохозяйственных культур. , Классификация видов музыки

Типы алгоритмов классификации ML:

Алгоритмы классификации можно разделить на две основные категории:

Линейные модели

  • Логистическая регрессия
  • Опорные векторные машины

Нелинейные модели

  • Классификация дерева решений
  • Случайная классификация леса
  • K-ближайшие соседи
  • Ядро SVM
  • Наивный байесовский

2. Неконтролируемое обучение

Давайте разберемся в обучении без учителя с помощью картинки

Вам и Голу понравилось играть в игру «Угадай фрукт». Тем не менее, у вас есть важная функция в доме друга, чтобы наверстать упущенное. Тем временем, чтобы занять Голу, вы даете ему еще одну игру. На этот раз вы поставили на стол изображение с фруктами и сказали Голу классифицировать эти фрукты, а сами отправились в место Друга.

Теперь давайте разберемся в неконтролируемом обучении со следующих точек зрения:

1.Данные: изображение с различными фруктами

2.Модель: сам Голу

3. Целевая функция: правильно ли Голу классифицирует фрукты?

4. Алгоритм оптимизации: поскольку мы не контролируем машину в отношении того, как решить нашу проблему, машина должна вычислить это самостоятельно и выполнить свои собственные оптимизации.

Поскольку вы находитесь в Функции, Голу должен играть в эту игру самостоятельно. Но на этот раз, увидев эти изображения, Голу запутался, как их классифицировать. так что теперь golu начинает заниматься этой деятельностью самостоятельно.

Поскольку вы находитесь в функции, поэтому некому контролировать голу, и он должен разобраться с этим самостоятельно. Отсутствие надзора и, следовательно, это называется неконтролируемым обучением.

Типы алгоритмов обучения без учителя:

Алгоритм обучения без учителя можно разделить на два типа задач.

  1. кластеризация

2. Ассоциация

мы будем обсуждать только «кластеризацию», как сейчас.

Кластеризация:

Кластеризация — это метод группировки объектов в кластеры таким образом, что объекты с наибольшим сходством остаются в группе и имеют меньшее или полное отсутствие сходства с объектами другой группы. Кластерный анализ находит общие черты между объектами данных и классифицирует их в соответствии с наличием и отсутствием этих общих черт.

Алгоритмы неконтролируемого обучения:

Ниже приведен список некоторых популярных алгоритмов обучения без учителя:

  • Кластеризация K-средних
  • KNN (k-ближайшие соседи)
  • Иерархическая кластеризация
  • Обнаружение аномалий
  • Нейронные сети
  • Анализ основных компонентов
  • Анализ независимых компонентов
  • Априорный алгоритм
  • Разложение по сингулярным значениям

3. Армирование:

давайте разберемся с армированием по изображению:

Представьте, что вы учите свою собаку, назовем ее Джимми, приносить палку. Каждый раз, когда Джимми успешно достает палку, вы предлагаете ему угощение (скажем, косточку). В конце концов, Джимми распознал эту закономерность, и каждый раз, когда вы бросаете палку, он пытается достать ее как можно быстрее, чтобы получить награду (кость), что приводит к тому, что время на добычу становится все меньше и меньше.

так что это конец введения ML, я надеюсь, что это поможет вам легко понять концепцию.

Спасибо!