Компромисс между смещением и дисперсией машинного обучения

Машинное обучение — это ветвь искусственного интеллекта, которая позволяет машинам выполнять анализ данных и делать прогнозы. Однако, если модель машинного обучения неточна, она может делать ошибки прогнозирования, и эти ошибки прогнозирования обычно известны как предвзятость и дисперсия. В машинном обучении эти ошибки всегда будут присутствовать, поскольку всегда есть небольшая разница между прогнозами модели и фактическими прогнозами.

Ошибки машинного обучения:

В машинном обучении ошибка — это мера того, насколько точно алгоритм может делать прогнозы для ранее неизвестного набора данных. На основе этих ошибок выбирается модель машинного обучения, которая может лучше всего работать с конкретным набором данных. В основном в машинном обучении есть два типа ошибок:

Уменьшаемые ошибки. Эти ошибки можно уменьшить, чтобы повысить точность модели. Такие ошибки могут быть дополнительно классифицированы как предвзятость и дисперсия.
Неустранимые ошибки. Ошибки, которые нельзя устранить, создавая хорошие модели. Это мера количества шума в наших данных.

Предвзятость:

При прогнозировании возникает разница между значениями прогноза, сделанными моделью, и фактическими значениями/ожидаемыми значениями, и эта разница известна как ошибки смещения или ошибки из-за смещения.

Ошибки смещения бывают низкого или высокого смещения.

Низкое смещение. Модель с низким смещением будет делать меньше предположений о форме целевой функции.
Высокое смещение. Модель с высоким смещением делает больше предположений, и модель становится неспособной отразить важные особенности нашего набора данных.

Когда модель имеет большое смещение, говорят, что это недостаточная подгонка данных. Модель с высоким смещением также не может хорошо работать с новыми данными.

Дисперсия:

Изменчивость прогноза модели для данной точки данных, которая говорит нам о разбросе наших данных, называется дисперсией модели.

Ошибки дисперсии бывают либо низкой дисперсии, либо высокой дисперсии.

Низкая дисперсия означает, что предсказание целевой функции незначительно отличается от изменений в наборе обучающих данных.

Высокая дисперсия указывает на большие различия в предсказании целевой функции при изменении набора обучающих данных.

Когда модель имеет высокую дисперсию, говорят, что это Переобучение данных.

Математически:

Во-первых, давайте определим «ошибку обобщения».

В приложениях для обучения с учителем в области машинного обучения и теории статистического обучения ошибка обобщения (также известная как ошибка вне выборки) — это мера того, насколько точно алгоритм может предсказывать значения результатов для ранее невиданных данных. википедия.

Ошибка обобщения может быть измерена MSE.

Пусть переменная, которую мы пытаемся предсказать, представляет собой Y, а другие ковариаты — как X. Мы предполагаем, что между ними существует взаимосвязь, такая, что

Y=f(X) + e

Где e — член ошибки, и он обычно распределяется со средним значением 0.

Мы создадим модель f ^ (X) для f (X), используя линейную регрессию или любой другой метод моделирования.

Таким образом, ожидаемая квадратичная ошибка в точке x равна

Err(x) можно далее разложить как

Различные комбинации смещения-дисперсии

Существует четыре возможных комбинации смещения и дисперсии, которые представлены на диаграмме ниже:

Низкое смещение, низкая дисперсия.
Сочетание низкого смещения и низкой дисперсии представляет собой идеальную модель машинного обучения. Однако практически это невозможно.
Низкое смещение, высокая дисперсия. При низком смещении и высокой дисперсии прогнозы модели в среднем непоследовательны и точны. Этот случай возникает, когда модель обучается с большим количеством параметров и, следовательно, приводит к переобучению.
Высокое смещение, низкая дисперсия. При высоком смещении и низкой дисперсии прогнозы согласуются, но в среднем неточны. Этот случай возникает, когда модель плохо учится на обучающем наборе данных или использует несколько значений параметра. Это приводит к недообучению проблем в модели.
Высокое смещение, высокая дисперсия.
При высоком смещении и высокой дисперсии прогнозы непоследовательны, а также в среднем неточны.

Как определить высокую дисперсию или высокую предвзятость?

Высокая дисперсия может быть выявлена, если модель имеет:

Низкая ошибка обучения и высокая ошибка теста.

Высокое смещение можно определить, если модель имеет:

Высокая ошибка обучения и ошибка теста почти аналогичны ошибке обучения.

Компромисс отклонения отклонения:

Если наша модель слишком проста и имеет очень мало параметров, она может иметь большое смещение и низкую дисперсию. С другой стороны, если наша модель имеет большое количество параметров, она будет иметь высокую дисперсию и низкое смещение.

Поэтому нам нужно найти правильный/хороший баланс без переобучения и недообучения данных.

Этот компромисс в сложности является причиной того, что существует компромисс между предвзятостью и дисперсией. Алгоритм не может быть более сложным и менее сложным одновременно.

Ошибка обобщения:

Чтобы построить хорошую модель, нам нужно найти хороший баланс между смещением и дисперсией, чтобы минимизировать ошибку обобщения.

Ошибка обобщения = погрешность² + дисперсия + неустранимая ошибка.

Оптимальный баланс смещения и дисперсии никогда не будет соответствовать модели больше или меньше.

Ссылки:

Прикладной курс ИИ
javapoint
geeksforgeeks

Спасибо за чтение!