Нежное введение в машинное обучение

Введение в машинное обучение

Машинное обучение, вероятно, является одной из самых захватывающих и разрекламированных областей информатики. Что отличает людей от машин, так это то, что люди учатся на собственном опыте. Но можно ли заставить машину учиться? И Ответ Да! Это возможно с помощью машинного обучения. Но что такое ML? Что оно делает? И что делает машинное обучение таким популярным? Не волнуйтесь, мы вас прикрыли. Но прежде чем перейти к этой теме, мы предлагаем вам ознакомиться с обзором Python из нашей серии руководств по Python.

Что такое машинное обучение?

Машинное обучение — это подобласть искусственного интеллекта, где люди обучают модель обучению, анализу и принятию решений. Модель машинного обучения со временем повышает свою эффективность, изучая свой опыт. Данные — это спасательный круг машинного обучения, и качество и количество данных могут существенно повлиять на производительность вашей модели. Вот почему хорошо знать, как манипулировать данными и строить подходящую модель с данными.

Как работает машинное обучение?

Давайте разберемся с работой модели машинного обучения на примере. Рассмотрим 5 домов со следующей спецификацией.

Площадь дома (в квадратных футах) Цена дома (в ₹)100012000050060000800800009001000001500180000Эти данные являются вымышленными

Предположим, что цена дома определяется исключительно площадью дома. У нас есть площадь пяти домов и соответствующая им цена. Итак, какой будет цена дома площадью 1200 квадратных футов? Основываясь на данных, которые мы взяли выше, мы можем сказать, что цена колеблется где-то между ₹ 140000 и ₹ 150000. Немного подумав, мы могли бы определить и цену. Но как заставить машину сделать предположение?

Чтобы понять это, давайте нанесем данные на график

Теперь, когда машина нанесет эти данные на график. Модель машинного обучения улучшит себя и найдет наилучшее соответствие линии на кривой, чтобы каждая точка на линии, т. е. (x, y), где x — площадь дома и y — прогнозируемая цена этого дома, эта линия будет располагаться на графике таким образом, чтобы прогнозируемые значения были ближе к фактическим значениям. Линия будет выглядеть примерно так.

Теперь для приведенной выше строки значение, соответствующее x (площадь) = 1200, равно y (цена) = 140451.

Описанный выше метод называется линейной регрессией. Мы узнаем больше в этой серии. Но как наша модель узнала, что именно эта линия подходит лучше всего? Теперь, прежде чем узнать, как он нашел линию, давайте разберемся, что такое линия? Линия — это именно то, что написано ЛИНИЯ. Но математически линия представляет собой уравнение вида

y = mx + c

Теперь модель начнет со случайных значений m и c, и, поскольку это случайные значения, это может быть что угодно, скажем, m = 300 и c = 9000.

Теперь линия будет принимать наши данные в качестве входных данных и обновлять значения m и c таким образом, чтобы линия лучше всего подходила для диаграммы рассеивания. Углубленная математика о том, как получить наилучшие значения для m и c, будет объяснена в разделе линейной регрессии, но, чтобы удовлетворить ваше любопытство, мы находим наилучшие m и c (или иногда называемые a и b) с помощью метода, называемого Обычный метод наименьших квадратов.

Что делает машинное обучение таким особенным?

Теперь вам может быть интересно, что же такого особенного в машинном обучении? Все, что в нем есть, — это просто математика в игре. И вы в основном правы, машинное обучение — это математика по своей сути. Но даже несмотря на то, что приведенный выше алгоритм является самым простым, тот факт, что тот же алгоритм может улучшить себя, чтобы соответствовать заданным данным, делает ML особенным. Вы просто вводите данные в алгоритм, и алгоритм будет улучшаться. И именно поэтому ML является особенным, вам не нужно переделывать свой алгоритм в соответствии с данными, вам просто нужны данные и оставить улучшение ML.

Многие современные ведущие бренды, такие как Facebook, Google, Netflix и Amazon, используют машинное обучение центральную часть их операций. У машинного обучения есть несколько приложений, работающих в режиме реального времени, которые стимулируют многие предприятия и приводят к экономии времени и денег. В частности, огромное влияние оказывает обслуживание клиентов и рекомендации продуктов, когда машинное обучение позволяет людям выполнять задачи быстрее и эффективнее.

Приложения машинного обучения

Применение систем машинного обучения также широко распространено в таких областях, как здравоохранение, банковское дело, электронная коммерция и т. д. Некоторые из широко используемых приложений – фильтрация спама в электронной почте, результаты веб-поиска, распознавание образов и изображений, рекомендации по видео. , Обнаружение мошенничества, обнаружение вредоносных программ, автоматизация бизнес-процессов (BPA) и т. д. Большинство платформ социальных сетей и сетей доставки контента используют алгоритмы машинного обучения, чтобы обеспечить более персонализированный и приятный опыт.

Предпосылки для того, чтобы стать инженером по машинному обучению

Базовые знания языков программирования и скриптовых языков.
Знание языков программирования, таких как Python или R (рекомендуется Python)
Среднее знание статистики и вероятности
Знание структур данных и алгоритмов.