Как работает подсчет очков на троне (часть 2)

В предыдущем сообщении блога мы обсудили критерий Келли и его связь с относительной потерей журнала, которая является основным показателем оценки на Троне. В этом сообщении блога мы объясняем, как работает подсчет очков для ранжирования игроков. Объяснение TLDR заключается в том, что ваш счет - это гипотетический банкролл, который вы можете увеличивать, делая более точные прогнозы для публики.

Петербургский парадокс

Вы заходите в казино и видите новую игру. Честная монета подбрасывается на каждом этапе игры. Первоначальная ставка составляет два биткойна и удваивается каждый раз, когда выпадает орел. Игра останавливается, когда появляется хвост. Сколько биткойнов вы готовы заплатить, чтобы сыграть в эту игру?

Хорошим местом для начала может быть вычисление ожидаемой ценности игры. Ожидаемая стоимость игры:

Если бы мы действовали в соответствии с ожидаемым значением, из вышесказанного подразумевается, что мы должны заплатить любую цену, которую мы можем, чтобы сыграть в игру. Большинству людей это не кажется интуитивно жизнеспособным - вы бы продали свой дом, чтобы играть в эту игру? Большинство людей предпочитают риск, иначе мы бы не стали диверсифицировать.

Теория полезности спешит на помощь

Даниэль Бернулли предложил решение в терминах теории полезности: интуиция подсказывает, что каждая дополнительная единица богатства для вас стоит меньше, что может быть представлено с помощью логарифмической функции полезности и неприятия риска :

С натуральными бревнами миллионер (1000000 долларов) заплатит около 21 доллара за игру в Санкт-Петербурге, а человек с 1000 долларов заплатит около 11 долларов. Существуют и другие типы функций полезности, которые могут быть более реалистичными с эмпирической точки зрения, но натуральные логарифмы обладают хорошими свойствами, подробно описанными Келли (1956).

Как показал Келли, максимизация логарифмической полезности эквивалентна максимальному увеличению ожидаемой скорости роста вашего банкролла. Мы исследовали это в предыдущем сообщении блога и как критерий Келли связан с логарифмическими потерями. Это основа того, как мы оцениваем игроков против публики:

Мы предполагаем, что игроки хотят максимизировать гипотетический банкролл и имеют предпочтения полезности журнала, то есть они делают ставки в соответствии с критерием Келли.

Чтобы увидеть, как это работает, предположим, что вы начинаете с гипотетического банкролла, равного 100. У вас есть вероятность 0,8 для события, а для публики - 1,5. По формуле Келли вы сделаете ставку:

Если вы проиграете это событие, ваш счет упадет со 100 до 60. Если вы выиграете это событие, ваш счет увеличится со 100 до 120. В этом суть того, как работает подсчет очков в Throne: вы увеличиваете гипотетический банкролл.

Патологии критерия Келли

Критерий Келли страдает некоторыми непривлекательными свойствами. Это приводит к большой нестабильности банкролла, что не нравится большинству практиков. Кроме того, предполагается, что вероятности известны. В реальной жизни мы не уверены в точности наших прогнозов, и сфера спорта также может со временем измениться. Эти факторы означают, что наивная Келли может обогнать.

По этим причинам Эд Торп и другие рекомендовали использовать стратегии дробного Келли, в которых мы умножаем дробное значение Келли на 1/2, 1/4 и так далее, чтобы уменьшить наши ставки и снизить волатильность банкролла. .

В Throne мы поощряем аналогичный подход с помощью вероятностного ансамбля. По сути, мы пересматриваем наше мнение с помощью общедоступной информации и смешиваем вероятности нашей модели с общедоступными вероятностями. Это эквивалентно дробному Келли, где дробь является функцией нашей уверенности.

Прецедент такого подхода исходит из модели Черного-Литтермана в финансах. В этой модели мы смешиваем ожидаемую доходность нашей модели с ожидаемой рыночной доходностью для получения апостериорной доходности. Это означает, что мы не переоцениваем распределение нашего портфеля в пользу нашей модели, что может привести к статистической ошибке оценки.

С сегодняшнего дня Throne использует этот подход, добавив уверенность в качестве дополнительного столбца, который игроки могут указать.

Уверенность - это значение от 0 до 1, которое определяет, насколько уверен игрок в своих прогнозах. Если их уверенность низка, они будут больше смешивать публичные вероятности и меньше делать ставки. Если их уверенность высока, они будут смешивать общественные вероятности с меньшими ставками и ставками больше. Это создает простой взвешенный ансамбль между вероятностями игрока и публики.

Вот как мы это делаем с Throne API Peyton:

На практике нам может потребоваться лучший способ определения достоверности, например оценка явной ансамблевой модели. Но это иллюстрирует простоту использования.

Выводы

Игроки On Throne оцениваются в соответствии с гипотетическим ростом банкролла с использованием ставок Келли. Ставка Келли может привести к чрезмерным просадкам, поэтому для решения этой проблемы мы позволяем игрокам указывать свою уверенность и создавать ансамбли с общедоступной вероятностью.

В заключительной части этого блога, состоящего из трех частей, мы расскажем, как начисляются XP за ваши прогнозы. В то время как ваш рейтинг трона - это мера, которая зависит от вашей индивидуальной производительности, XP - это мера, которая зависит от общей производительности платформы.

В сторону

Если вам понравился этот пост или вы хотите получить дополнительные справочные материалы для чтения, то я рекомендую книгу Маклина, Торпа и Зиембы Критерий инвестиций в рост капитала Келли: теория и практика.

Как работает подсчет очков на троне (часть 2)

Петербургский парадокс

Теория полезности спешит на помощь

Патологии критерия Келли

Выводы

Вопросы по теме