Прогнозы машинного обучения в бейсболе на 2022 год: взгляд на будущее

Мы вернулись! Всем удачного бейсбольного сезона. В прошлом году я опубликовал свой опыт построения бейсбольных прогнозов с использованием моделей машинного обучения. Я сделал это в двух частях:
1. Бейсбол и машинное обучение: подход науки о данных к прогнозам на 2021 год
2. Бейсбол и машинное обучение, часть 2: подход науки о данных к прогнозам на 2021 год. »

Я немного обновил свои модели в этом году, но в основном хотел расширить набор входных данных, чтобы самый последний сезон был нормальным (почти), полным сезоном, а не сезоном 2020 года с 60 играми, который разыгрывался, когда мир разваливался. . Таким образом, мои модели в этом году в основном отражали ту же методологию, которую я обсуждал в прошлом году. У меня уже есть некоторые мысли о том, как улучшить модели на следующий год. Я, вероятно, поработаю над ними в течение года и, надеюсь, напишу до начала сезона в следующий раз.

А пока я хочу сравнить мои прогнозы с успешными опубликованными прогнозами, а затем указать, в чем отличия этого года от тех же опубликованных прогнозов.

Выбросы Hitter 2021: результаты

Напомним, что в прошлом году я прогнал свои прогнозы через свою систему подсчета очков и сделал то же самое для прогнозов BAT, чтобы увидеть, в чем заключались основные различия. Это то, что у меня было. Во-первых, игроки, которых я планировал превзойти THE BAT.

Нападающие 2021 года, по прогнозам, превзойдут THE BAT

Хм. Ну, это вообще выглядит не очень. Я звоню 2–12–1. Может быть, мы можем быть добрыми и дать мне победу над Кроуфордом, чтобы сделать счет 3–12. Не хорошо. Я был почти уверен, что некоторые из них провалятся. Я совершенно не верил в эту проекцию Акино. У многих других в верхней части списка были очевидные проблемы с игровым временем, и модель не собиралась их учитывать. Тем не менее, я довольно хорошо отнесся к выбору Гричука, Кроуфорда и Уокера. Уокер весь год болел, так что, возможно, мы сможем пересдать его.

Мне действительно приходится напоминать себе, что я сталкиваюсь с прогнозами, которые превосходят большинство (или все) других. Тем не менее... это не удовлетворяет. Как насчет нападающих, которые, по моим прогнозам, будут хуже?

Нападающие 2021 года, по прогнозам, уступают THE BAT

Здесь немного лучше: 5–8–2. Как я писал в прошлом году, модель довольно сильно наказала плохую производительность 2020 года. Это также немного наказало травмы 2020 года. Я думал, что со Стэнтоном и Джаджем будет лучше, но в итоге они сыграли больше, чем предполагалось. Ни один из них не был особенно успешным, но модель определенно лучше предсказывала неудачников, чем выявляла победителей.

Выбросы стартового питчера-2021: результаты

Хорошо, здесь полное раскрытие… Я испортил этот раздел моей питчинговой статьи от 2021 года. Довольно серьезно. Мое единственное объяснение состоит в том, что это было последнее, что я делал, и я был поджарен на этом этапе процесса. По сути, я взял не тот столбец для номеров THE BAT. Мои оценки были правильными, но оценки BAT были совершенно неправильными, и, следовательно, различия между двумя наборами также были совершенно неправильными. Я переделал эти таблицы ниже и добавил результаты. Хорошо, тогда. Вот те, где, по моим прогнозам, питчеры превзойдут THE BAT. Для этого анализа я рассматривал только питчеров, которые должны были бросить не менее 100 иннингов.

Ожидается, что стартовые питчеры 2021 года превзойдут THE BAT

Я вырезал несколько записей из этого раздела для питчеров, которые пропустили весь год из-за травм (в основном тех, кого мы знали в начале года: Страсбург, Синдергаард и Сейл). Если вы думаете, что я слишком либерально называю некоторые из этих «толчков», что ж… возможно, вы правы. Однако я думал о них так: игроки значительно превзошли прогнозы THE BAT, даже если они все еще существенно отставали от моих показателей. Честно говоря, по этой логике я мог бы даже назвать эти победы, но я оставляю их в колонке push. (Кроме того, Вудрафф должен быть полностью «W», но, по иронии судьбы, его общее количество побед предотвратило это. Я признаю это, но я предпочитаю быть озлобленным.) Верно. Итак, что это, 3–8–4? Опять же, не впечатляюще, но прогнозы определенно выявили несколько питчеров, которые превзошли опубликованные цифры.

Диаграмма прогнозов неэффективных компаний немного сложна. Из-за 100 запланированных иннингов у меня действительно не было достаточного количества питчеров, чьи результаты были намного ниже, чем у THE BAT. На самом деле у меня было 15, но семеро из них в итоге пропустили слишком много года, чтобы пройти квалификацию (для протокола, это были Страм, Порселло, Анибал Санчес, Сорока, Кайл Райт, Лик и Луккези). В результате финальный стол немного скуден, но вот где мы оказались:

Ожидается, что стартовые питчеры 2021 года уступят THE BAT

4–4. Совсем неплохо. Кроме Уокера Бюлера. Это был довольно большой промах. На самом деле я не очень-то верил в прогнозы для него, но я должен сообщить об этом. Модель, которую мы наблюдали у нападающих, в основном использовалась для подачи: модели машинного обучения гораздо лучше выявляли неудачников, чем выявляли исключительно хороших исполнителей.

Прогнозы на 2022 год

Итак, как мы будем выглядеть в этом году? Это то, что говорят мои последние модели…

Нападающие 2022 года, по прогнозам, превзойдут THE BAT

В этом году моим моделям просто понравился Jeimer Candelario. Не совсем уверен, что там. Они также любили кучу резервных уловителей, но я установил порог для этого анализа в 350 предполагаемых появления тарелок. Но если Зак Коллинз, Виктор Каратини или Джона Хейм убьют его в этом году, что ж, мои модели имели представление об этом.

Ожидается, что нападающие 2022 года уступят THE BAT

Этот список страшно публиковать. Там есть несколько громких имен. Прогноз Траута явно опирается на его недавнее пропущенное время. Я понятия не имею, как Хуан Сото оказался здесь. Не буду врать: в 14 лет я думал о том, чтобы сократить этот список, просто чтобы сохранить лицо перед этим, но все дело в честности, дорогой читатель.

Ожидается, что стартовые питчеры 2022 года превзойдут THE BAT

Мой порог отсечки для прогнозов подачи составлял 100 прогнозируемых иннингов. Ясно, что это было сделано до травмы деГрома. На самом деле, первоначальная модель прогнозировала его примерно на 90 иннингов, а я скорректировал ее до 150 в своих окончательных прогнозах. Упс. Я, вероятно, должен был использовать окончательные номера моделей и выбросить его, но вот мы здесь. Модель снова любит Вудраффа. Имеет смысл.

Ожидается, что стартовые питчеры 2022 года уступят THE BAT

Итак, поехали. Счастливый бейсбольный сезон. Посмотрим, как это сработает.