Этапы построения модели
[См. Kaggle: ваша первая модель машинного обучения
](https://www.kaggle.com/dansbecker/your-first-machine-learning-model)
Шаги построения и использования модели:
- Определить. Какой тип модели это будет? Дерево решений? Какой-то другой тип модели? Задаются и некоторые другие параметры типа модели.
- Соответствие. Сопоставление шаблонов с предоставленными данными. Это сердце моделирования.
- Предсказывать: как это звучит
- Оценить. Определите, насколько точны прогнозы модели.
Недообучение и переоснащение
Обратитесь к Kaggle: Underfitting and Overfitting
- Переобучение. Модель почти идеально соответствует данным для обучения, но плохо прогнозирует новые данные.
- Недообучение. Модель не может уловить важные закономерности и различия в данных, поэтому она плохо работает даже с данными для обучения.
По мере того, как глубина Decision Tree Model
увеличивается, Underfitting
становится меньше, но есть 'поворот', при котором начинается Overfitting
, и ошибка становится больше.
Чтобы найти «поворотный момент», нам нужно проверить некоторые глубины , а именно max_leaf_nodes
. При котором ошибка начинает превращаться по убыванию в возрастание, мы выберем эту глубину как наилучшую глубину для обучающих данных в модели дерева решений.
-