Этапы построения модели

[См. Kaggle: ваша первая модель машинного обучения
](https://www.kaggle.com/dansbecker/your-first-machine-learning-model)

Шаги построения и использования модели:

  • Определить. Какой тип модели это будет? Дерево решений? Какой-то другой тип модели? Задаются и некоторые другие параметры типа модели.
  • Соответствие. Сопоставление шаблонов с предоставленными данными. Это сердце моделирования.
  • Предсказывать: как это звучит
  • Оценить. Определите, насколько точны прогнозы модели.

Недообучение и переоснащение

Обратитесь к Kaggle: Underfitting and Overfitting

  • Переобучение. Модель почти идеально соответствует данным для обучения, но плохо прогнозирует новые данные.
  • Недообучение. Модель не может уловить важные закономерности и различия в данных, поэтому она плохо работает даже с данными для обучения.

По мере того, как глубина Decision Tree Model увеличивается, Underfitting становится меньше, но есть 'поворот', при котором начинается Overfitting, и ошибка становится больше.

Чтобы найти «поворотный момент», нам нужно проверить некоторые глубины , а именно max_leaf_nodes. При котором ошибка начинает превращаться по убыванию в возрастание, мы выберем эту глубину как наилучшую глубину для обучающих данных в модели дерева решений.

-