Про корреляцию счетов и причины увеличения их количества в портфеле
Кто следит за структурой моего
дефолтного портфеля на сайте, наверное, обратил внимание, что начиная с июля счетов в портфеле стало заметно больше, чем раньше.
С сентября их количество еще вырастит, а процентное распределение станет более гладким
Всё это не случайно, т.к. с июля я немного иначе начал анализировать "неучтенную дисперсию модели" и сейчас продолжаю эксперименты.
Как уже было сказано ранее, чем выше рейтинг счета, тем точнее согласно моей модели для него определены показатели МО и СКО. Однако количество счетов в категории "А+" не очень велико: если составлять портфель только из них, то он получается слишком низкодоходным.
Поэтому включать счета из других категорий все же приходится, что приводит к "неучтенной дисперсии" -- т.е. в портфеле появляются счета, в оценке которых мы вероятно
значимо ошиблись, в т.ч. и в степени корреляции их доходности с остальными счетами.
Я решил опубликовать часть проведенного летом анализа на корреляцию, вероятно приверженцам технического подхода, который я использую, это будет интересно.
Про корреляцию счетов
Посмотрим доходность моих консервативных портфелей за первую половину лета 2014 года.
Что называется «найди три отличия от синусойды»
Напомню, что в консервативный портфель я вношу правки в среднем 1 раз в 6 недель (и не хочу пока делать это чаще), поэтому мне так необходим тщательный анализ доходности и показателей счетов "на входе".
Доходность в цифрах была такая:
Особое внимание привлекает результат недели 30.06 – 06.07 для фактического портфеля. Как можно заметить, на этой неделе доход портфеля отклонился от матожидания более чем на два СКО. Нужно обязательно проанализировать причины, для этого давайте посмотрим на доходность счетов, приведенных в таблице ниже.
В фактическом портфеле были следующие из минусанувших счетов: 7, 201, 1995, 2631, 2635, 2642.
Т.е. 6 счетов из 16 одновременно ушли в просадку. Логично задать вопрос: случайно ли такое совпадение? Ведь когда мы составляем портфель, то ориентируемся на принцип диверсификации, в котором очень важную роль играет отсутствие корреляции между доходностями активов в портфеле (иначе снижения рисков может не произойти).
Для ответа на этот вопрос нужно оценить насколько коррелирует доходность этих шести счетов на истории.
Те, кто пробовал экспериментировать с моим калькулятором доходности портфеля, видели наверное, что на первом листе приведена таблица корреляций. (Трогать ее не нужно, она используется в формулах автоматически.) Так вот, там используется способ расчета корреляции, который я использую по умолчанию в своих моделях. Способ незамысловатый, я беру прямые данные, обрабатываю выбросы, занижая их размер, потом считаю обычную корреляцию и оставляю полученные значения только там, где они получились значимыми (незначимые заменяю на нули, чтобы они не портили картину). Такой подход кажется мне сейчас наиболее универсальным.
Но если портфель начинает трясти, то на его структуру стоит посмотреть внимательнее, в т.ч. на корреляцию. Ключевой вопрос, который возникает при оценке корреляции: «что делать с выбросами?». Дело в том, что если вы возьмете любой учебник по статанализу и посмотрите, как там считают корреляцию, то обязательно увидите рекомендацию удалить выбросы перед расчетом.
Почему так? Потому что выбросы являются случайным редким отклонением признака. Однако, если для двух переменных выбросы произойдут одновременно и будут сильны, то тест на корреляцию может оказаться положительным только лишь по этой причине. Т.е. из-за особенности расчета корреляции как таковой выбросы могут «перебить» остальные данные и тест на корреляцию даст так называемый ложноположительный результат.
Я не могу сказать, что пришел к однозначному решению о том, как считать корреляцию для трейдеров, но просто удалить выбросы (как это принято в общем случае) я считаю неверным, поэтому по умолчанию их оставляю, но предварительно снизив размер.
В данном же случае перед нами конкретные счета, их не очень много, постоянными сильными выбросами их доходность не характеризуется, поэтому давайте ради интереса посчитаем корреляцию разными способами и посмотрим, что получится.
Чтобы эксперимент был чистым, добавим к исследуемым счетам еще счета 1996 и 1997, т.к. у них один управляющий и их графики доходности почти идентичны, т.е. корреляция очень сильная. Это поможет нагляднее увидеть результаты.
Когда нужно экспериментировать со статистической обработкой или делать прикидки вручную, то я использую Excel и SPSS (какие-то тесты удобнее делать в одной программе, какие-то – в другой). Для экспериментов с корреляциями SPSS намного удобнее. Тем, кто планирует сам попробовать делать расчеты, могу порекомендовать оупенсорсную версию SPSS, она называется PSPP – скачать можно
здесь. Для экспериментов и полупрофессиональных расчетов ее функционала вполне достаточно. Всё, поехали.
1) Давайте посчитаем корреляцию по чистым недельным данным, без всяких модификаций. Берем доход за 52 недели, получаем такой результат:
Для сравнения возьмем еще непараметрический тест (тау Кендалла)
2) Мы ведь хотим проверить не просто факт корреляции доходности счетов, нам гораздо важнее то, минусуют ли они одновременно или нет. Поэтому давайте перекодируем данные в дихотомию. Если доходность отрицательная – ставим -1; если положительная 1. (Если нулевая, то можно либо добавить к положительным либо оставить дополнительный код 0, это не принципиально) Смотрим:
3) Наконец посмотрим на результат корреляции, которую выдает мой дефолтный способ расчета с обработкой выбросов (его я использую в своем калькуляторе внутренних рисков).
Теперь можно проанализировать полученные данные о корреляции.
Коэффициент корреляции по модулю может принимать значения от 0 до 1. Посчитав коэффициент, нужно смотреть на его размер и значимость. Если значимости нет – сразу исключаем из расчетов. Если есть, то смотрим размер: принято считать, что до 0.3 корреляцией можно пренебречь, она несущественна; от 0.3 до 0.5 – слабая; от 0.5 до 0.7 средняя; более 0.7 – сильная.
Так вот, мы видим из таблиц, что счета 1996 и 1997 – подсадные утки – всегда сильно коррелируют, так и должно было получиться. Что касается исследуемых счетов, то если выбросы не обрабатывать, то есть очень слабая корреляция между доходностью только счетов 2635 и 2642. Если роль выбросов снизить (пункты 2 и 3), то корреляции нет вообще.
Вывод: то, что 6 счетов одновременно ушли в просадку на рассматриваемой неделе, вытащив доходность портфеля за 2 СКО, со статистической точки зрения является просто случайностью, т.к. на исторических данных между их доходностями нет корреляции. Поэтому инвестировать одновременно в эти счета можно, на дистанции это должно привести к снижению рисков портфеля.
Как можно видеть, вторая половина лета это пока подтверждает:
Тем не менее в реальности ситуация, когда портфель за 6 недель вырос всего на 1%, мне не понравилась. Поэтому я решил изменить принцип учета совокупной дисперсии, что привело к росту количества счетов в портфеле. По идее, график доходности должен стать ровнее, даже не смотря на "неучтенную дисперсию". Что ж, скоро узнаем.
Продолжение следует.