На этом занятии мы поговорим о машинном обучении, его работе и факторах, влияющих на его результаты. Прежде чем мы начнем, давайте сделаем небольшое упражнение, хорошо?
Взгляните на эти данные:
Теперь попробуйте ответить на вопрос — Какова ценность X?
Если ответ 12, вы правы. Что ж, как кто-то правильно сказал: «Дело не в пункте назначения, а в путешествии», так что давайте сделаем шаг назад и проанализируем, как вы, возможно, решили этот вопрос.
В первой строке мы видим, что в последовательности было десять букв. В следующей строке вы могли сделать вывод, что просто на один символ больше, чем в предыдущей последовательности, и, распространив эту логику на последнюю строку, X должно быть 12.
Итак, как вы пришли к выводу, что на одного персонажа больше, чем на предыдущий? Вы пересчитывали количество символов во втором ряду? Или вы визуально оценили длину первой и второй последовательности и вывели результат? Если вы выбрали первый подход, это хорошо. Вы узнаете, почему это хорошо, когда будете читать дальше. Но если вы выбрали последнее, это эффективный способ найти решение. В терминах ELI 15 именно этот последний подход и является тем, как работает машинное обучение.
Машинное обучение (ML) заключается в поиске закономерностей в известных данных (строки 1 и 2 выше) и использовании этого обучения для поиска неизвестного (в данном случае X в строке 3).
Пока вы делали вывод, нашли ли вы время, чтобы проверить, что последовательность первой строки действительно состоит из десяти символов? В этом простом примере я убедился, что данные действительны. Однако это не всегда так с данными в реальном времени, они сложны, а закономерности не так уж и тривиальны. Указывая на это, я хочу подчеркнуть важность данных в ML. Предположим, что первая последовательность в данных неверна, и если кто-то пропустит проверку данных, его ответ будет неверным. Этот навык имеет решающее значение для Data Scientist, чтобы понять, как модель ML учится — в данном случае подсчитывает количество букв — и гарантирует, что данные действительны для модели.
Во всей аналогии вы, возможно, уже поняли, что подсчет количества букв в последовательности — это процесс, требующий времени. Вероятно, значительная часть людей, читающих это, пропустила проверку по этой причине. Таким образом, обучение модели машинного обучения также требует много времени и ресурсов. Подумайте об этом так: время, необходимое для получения формулы с нуля, больше по сравнению с подстановкой значений в формулу для получения решения.
Надеюсь, с этим примером вы лучше понимаете машинное обучение. Теперь вам может быть интересно — что такое искусственный интеллект? Как эту аналогию можно распространить на искусственный интеллект?
Я займусь этим сейчас. Решили бы вы вышеуказанную задачу без данных во втором столбце? Бьюсь об заклад, вы бы так и сделали. Возможно, вы бы сами посчитали пару рядов и, установив закономерность, пришли бы к правильному ответу. ИИ работает именно так.
Подробнее об этом в следующем сеансе. А пока, удачного дня, добрый незнакомец.
О сериале:
ELI в ELI 15 — это общепринятая в Интернете аббревиатура от «Объясни, как я». 15. Учиться, разучиваться, переучиваться — это правильное мышление при прохождении этой серии. Обсуждаемые аналогии могут быть расширены по мере того, как вы будете больше узнавать и углубляться в темы.
Все материалы, представленные здесь, основаны на моем понимании этих концепций. Я предоставлю ссылки и кредиты на источники, где это применимо, в нижнем колонтитуле.