Математические основы линейной регрессии

Линейная регрессия — это самый простой, но самый интуитивно понятный алгоритм машинного обучения, поскольку он позволяет легко сопоставить значение «прогноза» с математической основой. Я написал эту статью после того, как много прочитал о математике, лежащей в основе работы различных алгоритмов машинного обучения. После прочтения нескольких статей и документов по теме я попытался написать эту статью, используя всю информацию и знания, которые я получил. Я попытался сжать математику и выводы, необходимые для того, чтобы прийти к используемым формулировкам довольно простым способом.

Надеюсь, вы найдете его информативным!

В линейной регрессии наша цель - установить линейную связь между зависимой (Y) и независимой переменной (X). Проще говоря, мы хотим найти функцию, которой удовлетворяют точки с X и Y в качестве абсцисс и ординат соответственно (X, Y). Итак, наша цель — найти коэффициенты такой линейной функции, представленной как a и b.

Но в реальных сценариях ни одна из зависимостей не является идеально линейной, поэтому функция не будет учитывать все точки. Цель линейной регрессии — найти наилучшую линейную функцию, которая соответствует большинству точек. Думайте об этом как о множестве случайных точек на миллиметровке. Линейная регрессия направлена на то, чтобы нарисовать прямую линию с фиксированным наклоном таким образом, чтобы все эти точки лежали на прямой. Но это невозможно, если точки просто разбросаны по всему месту случайным образом. В этом случае мы выбираем линию, которая проходит через большинство точек и находится на минимальном расстоянии от остальных.

Мы определяем другую переменную Y ̂(обозначаемую как y hat), которая обозначает предсказанные значения зависимой переменной Y. Теперь эти переменные могут отличаться от фактических значений, представленных Y.

Итак, мы начнем со следующих двух уравнений,