Математика помогает нам ответить
Сколько? Сколько? (Количественная оценка)

Введение

Машинное обучение может показаться сложным и пугающим, но по своей сути оно заключается в том, чтобы научить компьютер распознавать шаблоны и принимать решения на основе этих шаблонов. В этой статье мы разберем концепцию машинного обучения на простом и понятном примере: научить малыша собирать квадраты и избегать ромбов. Мы также рассмотрим математику, лежащую в основе измерения производительности моделей машинного обучения.

Игра «Формы» для малышей

Представьте, что мы пытаемся научить малыша подбирать квадраты и избегать ромбов. Наша задача — научить малыша «подбирать только квадраты и оставлять ромбы?» Для этого мы даем нашему малышу подсказки (факторы) о том, как выглядят квадраты и ромбы. Например, мы можем сказать им

  1. что квадраты имеют 4 стороны и 4 угла, и все стороны имеют одинаковую длину (см. рис. 1).
  2. С другой стороны, мы могли бы объяснить, что ромбы тоже имеют 4 стороны, но их углы заострены, а стороны скошены (см. рис. 2).

Затем малыш попытается найти лучший способ (алгоритм) собирать квадраты и избегать ромбов.

Важно показать нашему малышу равное сочетание квадратов и ромбов:

Чтобы помочь нашему малышу учиться лучше, нам нужно показать ему равное сочетание квадратов и ромбов.

  1. Если мы покажем малышу слишком много ромбов и всего несколько квадратов, он может не узнать, как лучше всего собирать квадраты.
  2. Когда мы даем нашему малышу равные шансы увидеть и узнать о квадратах и ​​ромбах, он сможет найти лучший способ подобрать только квадраты (см. рис. 3).

Измерение успеваемости нашего малыша с помощью баллов

Мы можем использовать показатель производительности, чтобы узнать, хорошо ли наш малыш собирает квадраты. Оценка успеваемости похожа на оценку, которая говорит нам, насколько хорошо малыш может находить квадраты (насколько хорошо он собирает квадраты) и избегать сбора бриллиантов (насколько хорошо он не собирает бриллианты).

Вот несколько различных способов, которыми наш малыш может научиться подбирать квадраты и избегать ромбов:

  1. Способ 1. Малыш выбирает фигуры по количеству сторон. Они выбирают фигуры с 4 сторонами, но могут случайно подобрать ромб.
  2. Способ 2. Малыш выбирает фигуры по количеству углов. Они выбирают фигуры с 4 углами, но могут снова подобрать ромб.
  3. Способ 3. Малыш выбирает фигуры по количеству сторон, углов и наличию прямых углов. При этом они могут аккуратно подбирать квадраты и избегать ромбов.

Мы можем рассчитать показатель производительности следующим образом (для ямы из 5 квадратов и 5 ромбов, как показано на рисунке 3).

Performance Score = Average of (correct) and (wrong)
 
Correct: How Good are they at Picking Squares?
Wrong: How Good are they at Not Picking Diamonds?

Сравнивая показатели эффективности различных способов обучения нашего малыша, мы можем выбрать лучший метод для сбора квадратов и избегания ромбов.

Связь терминов обучения малышей с терминами машинного обучения

Теперь, когда мы изучили, как мы можем научить нашего малыша собирать квадраты и избегать ромбов, давайте посмотрим, как эти концепции связаны с терминами машинного обучения. В следующей таблице сопоставлены термины для малышей, которые мы использовали, с соответствующими терминами машинного обучения:

Реальный пример: (фильтрация спама по электронной почте)

Точно так же, как научить малыша выбирать квадраты и избегать ромбов, модель машинного обучения можно научить идентифицировать и фильтровать спам, сохраняя при этом важные сообщения в папке «Входящие». Сбалансированные наборы данных и точные алгоритмы играют решающую роль в обеспечении эффективной работы спам-фильтра.

Краткое содержание

Изучая концепцию машинного обучения с помощью простой игры с фигурами и углубляясь в математику, лежащую в основе сбалансированной точности, мы можем лучше понять основы машинного обучения и его практическое применение в повседневных ситуациях. Сбалансированная точность рассчитывается по формуле:

Сбалансированная точность = (чувствительность + специфичность) / 2

Эта формула помогает нам количественно оценить эффективность различных методов подбора квадратов и избегания ромбов. Сравнивая сбалансированную точность различных методов, мы можем определить наиболее точный и эффективный метод для нашей цели. Такой подход к созданию визуальной модели и последующей ее количественной оценке с помощью математических формул помогает сделать сложные концепции более доступными и привлекательными, что в конечном итоге позволяет нам оценить мощь и потенциал машинного обучения в различных реальных приложениях.