Основной обзор и прочее ;)
Прежде чем начать говорить о том, что такое машинное обучение, его приложения и все такое прочее, давайте поговорим о предпосылках машинного обучения. В отличие от большинства других ИТ-работ, инженер ML должен не только иметь навыки кодирования, но и хорошо разбираться в математике. Без математики изучение машинного обучения похоже на саботаж плана, даже не начав его. Но с другой стороны, чтобы начать наше путешествие по ML, нам не нужно быть большим математиком или кем-то в этом роде, для начала будет достаточно некоторых базовых знаний. Итак, давайте посмотрим, какие предварительные условия:
- Основная статистика
- Основное исчисление
- Базовая линейная алгебра
- Базовый Python
Давайте проверим, поняли ли мы наши основы или нет.
- Матричное умножение -›
2. Вычислить производную -›
3. Подсчитайте количество букв, слов :
Напишите программу на Python для подсчета букв и слов в предложении с помощью функции (избегайте использования каких-либо предопределенных функций)
Решение :
Что такое машинное обучение?
Машинное обучение описывается как множество вещей, таких как следующий естественный шаг искусственного интеллекта, применение статистики, некоторые продвинутые алгоритмы и т. д. Но на самом деле ML — это все. Как и AI ML, он занимается пониманием, обработкой данных и разумным ответом на их основе, как и статистика, он оценивает данные с использованием различных расширенных формул, как и алгоритм, он предоставляет o/p на основе некоторых данных i/p.
Машинное обучение против традиционного программирования
Возьмем пример,
В традиционном программировании, чтобы отличить что-то или кого-то, скажем, чтобы распознать меня с помощью традиционного программирования, программе нужно искать очки, черные волосы и другие различимые вещи, которые должны быть упомянуты должным образом (жестко закодированы в программе).
тогда как в ML все, что нам нужно сделать, это передать многочисленные изображения нашего лица, и оно автоматически начнет узнавать меня с помощью различных алгоритмов.
Почему сейчас ML возможен, а десять лет назад этого не было?
Для работы с моделями машинного обучения нам нужно много данных, а для работы с ними нужны высокие вычислительные способности. Но если мы вернемся на десятилетие или два назад, мы вряд ли найдем какой-либо надлежащий объем данных, которые можно было бы использовать, а также вычислительная мощность в те дни была намного ниже, чем сейчас.
Но теперь почти все оцифровано, создавая огромное количество данных, которые можно использовать, а с повышением вычислительной мощности в настоящее время намного проще работать с машинным обучением.
Применение машинного обучения:
Использование машинного обучения можно увидеть повсюду: в спорте, здравоохранении, образовании, на фондовом рынке и во многих других областях. На самом деле очень трудно найти какую-либо область, в которой не было бы ни малейшего намека на М.Л.
Машинное обучение в основном имеет два аспекта:
- Искусственный интеллект
- Наука о данных
Что такое искусственный интеллект? Где выросло машинное обучение помимо ИИ?
Искусственный интеллект обычно подразумевается нечеловеческим агентом (компьютерами), который может имитировать человеческие способы мышления и действия в реальном мире. Но главное различие между ИИ и МО заключается в том, что вместо того, чтобы действовать как люди, МО имеет более широкий смысл, который можно описать как выполнение автономных действий, которые могут быть или не быть такими же, как у людей.
Основные загадки искусственного интеллекта:
- Интеллектуальные агенты имеют ограниченные ресурсы.
- Вычисления локальны, но проблемы имеют глобальные ограничения.
- Логика дедуктивна, но многие проблемы — нет.
- решение проблем, рассуждения и обучение сложны, но объяснение и обоснование еще более сложны.
Основные характеристики задач ИИ:
- Знания часто приходят постепенно.
- Проблемы демонстрируют повторяющиеся модели.
- Проблемы имеют несколько уровней детализации.
- Многие задачи не поддаются вычислительному решению.
- Мир динамичен, но Знание о мире статично.
- Мир открыт, но знания ограничены.
ИИ как управление НЕОПРЕДЕЛЕННОСТЬЮ
AI = Что делать, если не знаешь, что делать?
Причины неопределенности:
- Пределы датчика
- противники
- Стохастическая среда
- Лень
- Невежество
Пример проблем ИИ:
- Отвечая на опасные вопросы.
- Настройка размеров для подвала нового дома.
- Завязывание шнурков
- Выбор маршрута к новому пункту назначения.
- Осмысление новостной передачи.
- Создаем роботов, которые ходят по воде! ;)
- Изготовление цветочного горшка, который можно использовать как чашку для питья ;)
- Решить, является ли новое животное птицей.
Прежде чем двигаться дальше, мы должны сначала узнать о правиле Байеса. Многие из нас уже знают, что это такое. Итак, я вкратце коснусь этой темы. ХОРОШО! поэтому возникает первый вопрос: почему я вдруг говорю о правиле Байеса? Итак, для начала теорема Байеса является одним из основополагающих элементов искусственного интеллекта, а также важной концепцией машинного обучения. Перед тем, как мы начнем понимать теорему Байеса, необходимо иметь некоторые базовые сведения о статистике, которые, я думаю, мы все знаем.
Правило Байеса:
где А и В — события. И Р(В) ≠ 0
- P(A | B) — это условная вероятность: вероятность того, что событие A произойдет при условии, что B истинно. Ее также называют апостериорной вероятностью A, заданной B.
- P(B | A) также является условной вероятностью: вероятностью возникновения события B при условии, что A истинно, поскольку P(B | A) = L(A |B)
- P(A) и P(B) — вероятности наблюдения A и B соответственно без какого-либо заданного условия; они известны как предельная вероятность или априорная вероятность.
- A и B должны быть разными событиями.
Что такое наука о данных?
Наука о данных — это область исследования, которая работает с огромными объемами данных с использованием современных инструментов и методов для поиска невидимых закономерностей, получения значимой информации и принятия бизнес-решений. Наука о данных использует сложные алгоритмы машинного обучения для построения прогностических моделей.
Кто такой специалист по данным?
Базовые навыки специалиста по обработке и анализу данных:
Основная экспертиза:
— Знает, какие вопросы задавать
- может хорошо интерпретировать данные
— понимает структуру данных
— Специалисты по данным часто работают в командах
Задачи, решаемые наукой о данных:
- Рекомендация фильмов (на таких сайтах, как Netflix, Amazon Prime)
- Социальные сети (Facebook, Instagram и многие другие)
- Веб-приложения (Tinder, Uber и т. д.)
- Биоинформатика (Понимание генных данных)
- Городское планирование
- Астрофизики (анализ стартовых скоплений и многое другое)
- Здравоохранение
- Виды спорта
Индукция и дедукция:
Индукция – при заданной причине и следствии выведите правило.
Вывод-› Учитывая правило и причину, выведите следствие.
Похищение – при заданном правиле и следствии похищайте причину.
Машинное обучение в основном представляет собой индукцию, потому что в машинном обучении, учитывая данные о причине и следствии, мы пытаемся создать правильное отношение/правило, которое используется для прогнозирования неизвестного эффекта для другой причины.
Что такое машинное обучение?
Использование и разработка компьютерных систем, способных обучаться и адаптироваться без явных инструкций, данных им, с использованием алгоритмов и статистических моделей для анализа и получения выводов на основе закономерностей в данных.
Типы машинного обучения:
В основном существует 3 типа алгоритмов ML-›
- Контролируемое машинное обучение
- Неконтролируемое машинное обучение
- Повторное обучение
Обучение с учителем . Обучение с учителем — это тип машинного обучения, при котором машины обучаются с использованием хорошо "помеченных" обучающих данных, и на основе этих данных машины прогнозируют результат.
Обучение без учителя. Обучение без учителя – это тип машинного обучения, при котором модели обучаются с использованием немаркированного набора данных и могут работать с этими данными без какого-либо контроля.
Обучение с подкреплением . Обучение с подкреплением работает на основе процесса, основанного на обратной связи, в котором агент ИИ (программный компонент) автоматически исследует свое окружение, нанося удары и отслеживая, предпринимая действия, учась на опыте и повышение его производительности.
В этом блоге я попытался дать базовый обзор машинного обучения. В следующем блоге я расскажу об исследовании выживания на Титанике, а после этого углублюсь в теорию и практику.