Это первая часть поста, состоящего из двух частей, иллюстрирующего практическую важность учета как нелинейностей, так и временных зависимостей при оценке риска портфеля, чего не учитывает широко распространенный коэффициент корреляции (Пирсона).

В этом посте мы даем базовое введение в корреляцию Пирсона, ее связь с линейной регрессией и бета портфолио, а также ее ограничения в отношении измерения зависимости между активами.

В Части II мы приводим эмпирические доказательства того, что i.i.d. Допущение Гаусса для доходности активов не выполняется для акций и фьючерсов США, и мы представляем альтернативу корреляции Пирсона, а именно корреляцию с поправкой на информацию, которая измеряет связь между временем рядов (не случайных величин), при этом полностью улавливая нелинейности и, что более важно, временные структуры. Затем мы используем корреляцию с поправкой на информацию для построения теоретико-информационной альтернативы (CAPM) бета портфеля, которую мы называем бета-версией с поправкой на информацию .

Что такое корреляция?

Фон

Вообще говоря, корреляция (или взаимосвязь) - это любая мера ассоциации или зависимости между двумя явлениями, каждое характеризуется рядом.

На практике интересующие нас явления обычно слишком сложны, чтобы их можно было охарактеризовать точными инвариантными детерминированными законами, такими как законы физики. Вместо этого мы соглашаемся выразить отсутствие детального понимания как случайность и обращаемся к разделу математики, который называется теорией вероятности, чтобы изучить ансамблевые свойства наших явлений. Одним из таких свойств ансамбля является связь между двумя случайными явлениями.

В остальной части этого поста мы считаем, что каждое интересующее случайное явление проявляется через одно число, которое мы обозначаем связанной с ним случайной величиной, и мы будем обозначать корреляцию между двумя случайными переменные корреляция между связанными случайными явлениями.

Корреляция Пирсона

Как и следовало ожидать, на протяжении многих лет предлагалось множество способов измерения корреляции между двумя случайными величинами.

Коэффициент корреляции Пирсона, на сегодняшний день самый популярный показатель корреляции, представляет собой число от -1 до 1, которое отражает склонность двух случайных явлений к линейной связи. То есть корреляция Пирсона измеряет степень, в которой, если бы мы сопоставили наблюдения одной случайной величины с наблюдениями другой на диаграмме рассеяния, график выглядел бы как прямая линия.

Чем ближе корреляция Пирсона к -1 или 1 (соответственно 0), тем сильнее (соответственно слабее) свидетельство линейной связи между двумя случайными величинами. Положительная корреляция Пирсона указывает на то, что когда одна случайная величина принимает большое (или малое) значение, то же самое делает и другая. Отрицательная корреляция Пирсона указывает на то, что когда одна случайная величина принимает большое (соответственно малое) значение, другая принимает маленькое (соответственно большое) значение.

Почему так популярна корреляция Пирсона?

Популярность корреляции Пирсона как меры зависимости между двумя случайными величинами может быть объяснена ее общим характером в частном случае гауссовых распределений.

Действительно, когда две случайные величины являются совместно гауссовскими, корреляция Пирсона полностью отражает степень, в которой существует какая-либо связь (линейная или нелинейная) между ними. Более того, гауссовские распределения играют ключевую роль в теории вероятностей и ее приложениях.

Для математиков они представляют собой самое простое семейство вероятностных распределений, с которыми можно работать, они были тщательно изучены, они часто неожиданно возникают в, казалось бы, не связанных между собой задачах вероятности, и результаты о них изобилуют в литературе.

Для статистиков гауссианы - благо из-за их аналитической управляемости, того факта, что ошибки, возникающие при оценке свойств неизвестных распределений, обычно ведут себя как гауссианы - даже когда оценочные распределения не являются таковыми - благодаря семье результаты, часто называемые центральными предельными теоремами, и тот факт, что они принадлежат к экспоненциальному семейству распределений, которое само по себе играет ключевую роль в байесовской статистике, - это лишь несколько причин.

Для исследователей машинного обучения распределение Гаусса возникает естественным образом как решение некоторых важных задач оптимизации распределений вероятностей. Одной из таких проблем является проблема максимальной энтропии, цель которой - найти среди всех распределений вероятностей, согласующихся с наблюдаемыми эмпирическими данными, то, которое больше всего не знает обо всем остальном.

Корреляция Пирсона и линейная регрессия

Корреляцию Пирсона и линейную регрессию можно рассматривать как две стороны одной медали.

В случае стандартизованных двух скалярных случайных величин x и y коэффициент корреляции Пирсона ρ между y и x можно интерпретировать как наклон наилучшего линейного соответствия между y и x:

Как оказалось, даже в случае линейного соответствия между случайным скаляром y и случайным вектором X , оба стандартизированные,

вектор, обеспечивающий наилучшее линейное соответствие, а именно β, полностью определяется коэффициентами корреляции Пирсона между y и входные данные вектора X и коэффициенты корреляции Пирсона между координатами X

Когда координаты входного вектора X декоррелированы (имеют корреляцию Пирсона 0), наилучшее линейное соответствие согласно приведенному выше уравнению достигается путем установки i -я координата β корреляции Пирсона между y и i - -я координата X

В более общем плане линейная аппроксимация полностью определяется коэффициентами корреляции Пирсона и имеет вид

где каждый - это матрица корреляции Пирсона между (координатами) левого индекса и (координатами) правого индекса.

Учитывая, что все координаты β равны 0 тогда и только тогда, когда все входные координаты X декоррелированы с y, следует, что линейный регрессию можно рассматривать как многомерное обобщение корреляции Пирсона.

Линейная регрессия в финансах

Линейная регрессия широко распространена в финансах. От CAPM до APT, факторных моделей Фама-Френча и премиальных коммерческих факторных моделей, почти все факторные модели риска, используемые в финансах, основаны на линейной регрессии вместе с предположением, что доходность активов равна i.i.d. сквозь время.

Прогностические модели, обычно используемые Quants, также сильно зависят от линейной регрессии, либо в ее исходной формулировке (например, OLS, авторегрессия и векторная авторегрессия и т. Д.), Либо регуляризованной (например, Ридж-регрессия, LASSO, и т. д.) для работы с зависимыми входными переменными и / или выполнения выбора переменных.

Линейная регрессия также находит применение при обнаружении причинно-следственной связи (например, причинность Грейнджера).

Корреляция Пирсона и бета-версия портфеля (CAPM)

Модель ценообразования капитальных активов (CAPM), которой мы обязаны понятиям альфа, бета и рыночной нейтральности, постулирует, что избыток доходность портфеля сверх безрисковой ставки может быть разложена на случайный рыночный компонент, величина которого определяется коэффициентом beta, детерминированным идиосинкразическим средним термином избыточной доходности альфа и идиосинкразический остаточный член со средним нулевым значением.

По определению, портфель считается рыночно-нейтральным, когда его бета равна 0. Можно показать, что в соответствии с CAPM,

Это означает, что портфель является рыночно-нейтральным тогда и только тогда, когда его доходность декоррелирована с рыночной доходностью.

Ограничения корреляции Пирсона в финансах

I.i.d. Гауссовское предположение, при котором корреляция Пирсона фиксирует любой тип связи между двумя случайными величинами, представляет собой серьезные ограничения в финансовых приложениях.

Декорреляция не предполагает независимости; поэтому рыночно-нейтральные портфели не всегда являются рыночно-нейтральными!

Как (должно быть) учат в любом курсе теории вероятности 101, декорреляция не всегда подразумевает независимость! В частности, если доходность рыночно-нейтрального портфеля не совпадает с гауссовой вместе с рыночной доходностью, тогда эти рыночно-нейтральные портфели могут фактически зависеть от рынка! Это очевидное утверждение, которое слишком часто упускают из виду практикующие.

Хуже всего то, что в таком случае остаточная связь между так называемым рыночно-нейтральным портфелем и рынком может проявляться только в хвостах (более высокие моменты распределения) - доходность рыночно-нейтрального портфеля не зависит от ассоциации первого порядка с рыночной доходностью, но не обязательно свободны от более высоких порядков / нелинейных ассоциаций.

Нейтральный по отношению к рынку портфель может быть хорошо застрахован в нормальных рыночных условиях, но он может быть в значительной степени подвержен экстремальным колебаниям, известным как «черные лебеди» в масштабах всего рынка.

Хороший управляющий фондом, всегда предполагающий линейность, похож на французского шеф-повара Пола Бокюза, который просит своих поставщиков продуктов открыть его ресторан!

Связанный с этим недостаток использования корреляции Пирсона в финансах заключается в предположении, что линейность отражает суть любой связи между двумя случайными величинами. Однако на самом деле все регрессионные модели являются как линейными, так и нелинейными, в зависимости от того, какие наблюдения входных явлений используются в качестве справочных.

Рассмотрим регрессионную модель

где f - нелинейная функция. Очевидно, что эта модель предполагает нелинейную связь между y и x. Однако ту же модель можно также рассматривать как постулирующую линейную связь между y и f (x).

При этом x и f (x) можно рассматривать как два разных способа наблюдения одного и того же случайного явления. . Процесс наблюдения за лежащим в основе случайным явлением обычно осуществляется поставщиком данных или подразумевается произвольными соглашениями (например, спецификациями контрактов на обмен и т. Д.). Всегда предполагать, что линейность сохраняется в представлении, предоставленном вам вашим поставщиком данных или обменом, - это все равно, что предполагать, что поставщик данных или обменник выполняли (большую часть) вашу работу. Если бы они хорошо справлялись с вашей работой, они бы управляли вашим фондом.

Возьмем конкретный игрушечный пример. Предположим, что мы заинтересованы в изучении взаимосвязи между стоимостью австралийского доллара в долларах США и стоимостью новозеландского доллара (NZD) в долларах США. Предположим, мы решили использовать линейную регрессию. Следует ли нам снижать сами ставки? Логарифмы ставок? Их ежедневные доходы? Какая-нибудь другая трансформация ставок? Очевидно, что каждый сценарий приведет к совершенно другой модели, и не задавать эти вопросы так же хорошо, как позволить поставщикам данных и биржам создавать наши модели для нас.

Чтобы использовать линейные модели, нужно дополнительно попытаться понять, еще лучше узнать из данных, какое преобразование сделает линейное предположение полезным.

Здесь стоит подчеркнуть, что любимый экономистами t-тест, и другие тесты статистической значимости, не могут использоваться для доказательства действительности линейное предположение. Они проверяют наличие (ненулевых) эффектов первого порядка, они не проверяют отсутствие (ненулевых) эффектов более высокого порядка.

Таким образом, мы все должны быть похожи на покойного французского шеф-повара Пола Бокюза: сильно беспокоиться о качестве ингредиентов, которые мы используем, но еще больше беспокоиться о том, как их соединить, чтобы приготовить идеальное блюдо (или предсказуемое / модель риска).

Всегда предполагаю, что возврат будет i.i.d. это все равно что клясться, что рынки полностью эффективны, и что вы, тем не менее, можете генерировать альфу!

Сама суть погони за альфой состоит в предположении, что прошлое так или иначе связано с будущим, что будущее можно в некоторой степени предвидеть, или, говоря математическим языком, что рынки как стохастическая система обладают памятью.

Поэтому нелогично и искать альфу, и предполагать, что динамика рынка не имеет памяти. Если бы рынки не обладали памятью, как можно было бы изучать систематические стратегии на основе данных (т. Е. Зарабатывать деньги как квантовый фонд)? Тем не менее, очень большое количество моделей риска основано на факторных моделях, которые предполагают, что временные ряды доходности не имеют памяти. Это предположение не только несовместимо с эмпирическими данными, но и может скрывать большой риск, как мы увидим в Части II.

Чтобы узнать об альтернативе корреляции Пирсона для измерения риска в вашем портфеле с учетом нелинейностей и временной зависимости, а также об альтернативе бета-версии CAPM, прочтите Часть II этого сообщения и нашу Желтую книгу для более технической информации. обсуждение.