Привет, Асад здесь. Надеюсь, вы уже прочитали две мои мини-статьи о логистической регрессии, если не нажмите здесь, чтобы прочитать часть 1 и часть 2.

Как обсуждалось в прошлой статье, мы знаем, что будем использовать максимальную вероятность, чтобы лучше всего подогнать волнистую линию к точкам данных. Давайте посмотрим, как подобрать и выбрать наиболее подходящий для классификации.

На приведенном выше графике у нас есть ось Y, которая имеет вероятность сдачи экзамена, ответ должен быть либо сдан, либо не сдан. Мы уже подгоняли волнистую линию в предыдущей статье, вспомните ее. Там мы использовали причудливую формулу для преобразования журнала (коэффициент сдачи экзамена) в вероятность сдачи экзамена и подобрали к нему волнистую линию.

На приведенном выше графике мы изображаем волнистую линию и значения, указанные на ней, давайте вычислим максимальную вероятность для данной волнистой линии (ПРИМЕЧАНИЕ: помните, что в наших данных у нас есть две вещи для классификации: одна — проходит, а другая — не проходит, т. е. нам нужно вычислить здесь максимальная вероятность как для Pass, так и для Fail параметров.

Вероятность данных данных (прохождение) = 0,50 × 0,76 × 0,80 × 0,96 × 0,9 ___ (мы просто перемножили значения)

ПРИМЕЧАНИЕ. Чем ниже вероятность прохождения, тем выше вероятность отказа. Таким образом, эта вероятность отказа равна (1-вероятность прохождения)

Вероятность данных данных (непройдена) = (1-0,50) × (1-0,76) × (1-0,80) × (1-0,96) × (1-0,9)

Вероятность данных, заданных волнистой линией = 0,50 × 0,76 × 0,80 × 0,96 × 0,9 × (1–0,50) × (1–0,76) × (1–0,80) × (1–0,96) × (1–0,9)

Вероятность можно рассчитать как произведение индивидуальной вероятности, но в большинстве случаев мы используем логарифм вероятности.

log (вероятность данных, заданных волнистой линией) = log (0,50) + log (0,76) + (0,80) + log (0,96) + log (0,99) + log (1–0,50) + log (1–0,76) + log ( 1–0,80)+log(1–0,96)+log(1–0,9)

Вместо использования продукта мы просто добавляем сюда логарифм для расчета логарифма (вероятность данных, заданных волнистой линией).

Точно так же мы поворачиваем линию и вычисляем максимальное значение волнистой линии, и это все, значение с максимальным значением является наиболее подходящей линией для заданных данных.

Надеюсь, вы поняли, что я здесь написал, если не попытаетесь связаться со мной для получения четкого объяснения. Понравился мой контент, а затем поддержите меня, нажав кнопку «Подписаться». Итак, дааа, увидимся тогда, увидимся в следующем.