На этом занятии мы поговорим о машинном обучении, его работе и факторах, влияющих на его результаты. Прежде чем мы начнем, давайте сделаем небольшое упражнение, хорошо?

Взгляните на эти данные:

Теперь попробуйте ответить на вопрос — Какова ценность X?

Если ответ 12, вы правы. Что ж, как кто-то правильно сказал: «Дело не в пункте назначения, а в путешествии», так что давайте сделаем шаг назад и проанализируем, как вы, возможно, решили этот вопрос.

В первой строке мы видим, что в последовательности было десять букв. В следующей строке вы могли сделать вывод, что просто на один символ больше, чем в предыдущей последовательности, и, распространив эту логику на последнюю строку, X должно быть 12.

Итак, как вы пришли к выводу, что на одного персонажа больше, чем на предыдущий? Вы пересчитывали количество символов во втором ряду? Или вы визуально оценили длину первой и второй последовательности и вывели результат? Если вы выбрали первый подход, это хорошо. Вы узнаете, почему это хорошо, когда будете читать дальше. Но если вы выбрали последнее, это эффективный способ найти решение. В терминах ELI 15 именно этот последний подход и является тем, как работает машинное обучение.

Машинное обучение (ML) заключается в поиске закономерностей в известных данных (строки 1 и 2 выше) и использовании этого обучения для поиска неизвестного (в данном случае X в строке 3).

Пока вы делали вывод, нашли ли вы время, чтобы проверить, что последовательность первой строки действительно состоит из десяти символов? В этом простом примере я убедился, что данные действительны. Однако это не всегда так с данными в реальном времени, они сложны, а закономерности не так уж и тривиальны. Указывая на это, я хочу подчеркнуть важность данных в ML. Предположим, что первая последовательность в данных неверна, и если кто-то пропустит проверку данных, его ответ будет неверным. Этот навык имеет решающее значение для Data Scientist, чтобы понять, как модель ML учится — в данном случае подсчитывает количество букв — и гарантирует, что данные действительны для модели.

Во всей аналогии вы, возможно, уже поняли, что подсчет количества букв в последовательности — это процесс, требующий времени. Вероятно, значительная часть людей, читающих это, пропустила проверку по этой причине. Таким образом, обучение модели машинного обучения также требует много времени и ресурсов. Подумайте об этом так: время, необходимое для получения формулы с нуля, больше по сравнению с подстановкой значений в формулу для получения решения.

Надеюсь, с этим примером вы лучше понимаете машинное обучение. Теперь вам может быть интересно — что такое искусственный интеллект? Как эту аналогию можно распространить на искусственный интеллект?

Я займусь этим сейчас. Решили бы вы вышеуказанную задачу без данных во втором столбце? Бьюсь об заклад, вы бы так и сделали. Возможно, вы бы сами посчитали пару рядов и, установив закономерность, пришли бы к правильному ответу. ИИ работает именно так.

Подробнее об этом в следующем сеансе. А пока, удачного дня, добрый незнакомец.

О сериале:

ELI в ELI 15 — это общепринятая в Интернете аббревиатура от «Объясни, как я». 15. Учиться, разучиваться, переучиваться — это правильное мышление при прохождении этой серии. Обсуждаемые аналогии могут быть расширены по мере того, как вы будете больше узнавать и углубляться в темы.

Все материалы, представленные здесь, основаны на моем понимании этих концепций. Я предоставлю ссылки и кредиты на источники, где это применимо, в нижнем колонтитуле.