Точность и полнота — две важные метрики, используемые для оценки производительности моделей классификации, особенно когда распределение классов несбалансировано. Давайте разберем их с помощью простой аналогии и примера.

Аналогия:

Представьте, что вы рыбак и ловите рыбу сетью в пруду. Рыба в пруду представляет собой истинное срабатывание (то, что вы хотите поймать), тогда как любые другие объекты, такие как сорняки, палки или мусор, представляют собой ложное срабатывание (то, что вы не хотите ловить).

  • Точность: сколько из всего, что вы поймали сетью, на самом деле было рыбой? Точность измеряет точность вашего улова.
  • Точность = количество пойманной рыбы. Общее количество пойманных предметов (рыба + другие объекты). Точность = Общее количество пойманных предметов (рыба + другие объекты). Количество пойманной рыбы.

  • Вспомните: Сколько из всех рыб в пруду вам удалось поймать? Вспомните, насколько эффективно вы поймали всю доступную рыбу.
  • Recall=Количество пойманной рыбыВсего рыбы в прудуRecall=Всего рыбы в прудуКоличество пойманной рыбы​

Пример:

Предположим, вы создаете модель для обнаружения спам-сообщений. Посмотрим на результаты упрощенно:

  • True Positive (TP): спам-сообщения правильно идентифицируются как спам.
  • Ложное срабатывание (FP): электронные письма, не являющиеся спамом, ошибочно идентифицированы как спам.
  • Истинно отрицательный результат (TN): электронные письма, не являющиеся спамом, правильно идентифицируются как не спам.
  • Ложноотрицательный результат (FN): спам-сообщения ошибочно идентифицированы как не спам.

Теперь, исходя из этих определений:

  • Точность подскажет вам, сколько писем, помеченных вами как спам, на самом деле были спамом. Это показатель того, насколько «точен» ваш спам-фильтр.

  • Напомним, вы узнаете, сколько спам-сообщений вам удалось перехватить. Это мера способности вашего спам-фильтра «отпоминать» или обнаруживать весь спам.

Мнемоника:

  1. Точность: Точный = Правильный. Думайте об этом так: «Сколько из утверждений, которые мы назвали положительными, на самом деле верны?»
  2. Напомним: вспомните общее количество фактических положительных результатов. Думайте об этом так: «Сколько реальных положительных случаев мы обнаружили или вспомнили?»

Во многих сценариях существует компромисс между точностью и отзывом. Если вы попытаетесь поймать каждую рыбу в пруду (высокая точность), вы можете поймать и много других объектов (более низкая точность). И наоборот, если вы очень точны и ловите только рыбу (высокая точность), вы можете упустить всю доступную рыбу (низкая точность).

Понимание этого компромисса и знание того, когда следует отдать приоритет одному показателю над другим, является ключом к созданию эффективных моделей классификации для различных приложений.