Главная Статьи Управление капиталом Статистика для трейдера. Лекция №1. Способы описания случайной величины
Статистика для трейдера. Лекция №1. Способы описания случайной величины
31.01.2011 11:09

Важнейшим понятием в теории вероятностей и математической статистике является понятие случайной величины. Не вдаваясь в философские дебри, назовем случайной величиной всякую характеристику, значение которой не известно заранее. Говоря по-простому, случайная величина – это цифра, которая может принимать значения в некотором диапазоне. Напр., при броске игральной кости может выпасть число от 1 до 6, а возможный интервал завтрашних цен некоторой акции может быть от 99 до 100 рублей. В этой лекции мы рассмотрим понятие случайной величины применительно к финансовым рынкам, а также узнаем о способах ее описания, таких как плотность вероятности, функция распределения, квантильная и характеристическая функции.


Виды случайных величин

В теории принято различать дискретные и непрерывные случайные величины. Дискретные величины характеризуются тем, что количество вариантов их значений можно пересчитать. Напр., можно рассмотреть величину «свечка» принимающую два значения: «бычья» и «медвежья», или величину пунктового изменения цены с целыми значениями от нуля и (теоретически) до бесконечности. Непрерывные величины могут принимать какие угодно значения – с любым числом знаков после точки, напр., как число пи. К какому виду следует отнести цену? В принципе цена дискретна, поскольку все ее возможные значения можно пометить, пересчитать. Особенно это становится заметным на мелких тайм-фреймах. Однако на практике во многих ситуациях проще считать, что цена может принимать любые значения, т.е., что она является непрерывной случайной величиной. Математика при этом становиться на порядок проще – можно задействовать ее классический аппарат – производные, интегралы и т.п. Кроме того, как будет показано, для статистического анализа сама цена не представляет собой никакого интереса. Наиболее адекватной характеристикой в этом смысле является процентная доходность – простая или логарифмическая, а эта величина уже может принимать любые мыслимые значения, а не только целые числа.


Проблема стационарности

Чтобы статистические выводы имели прогностическую силу, измеряемые величины должны быть устойчивыми, или, по крайней мере, их статистические свойства должны не слишком быстро меняться во времени. Само слово «статистика» подразумевает статичность, стационарность. По этой причине цена, хоть она и является наиболее натуральной величиной на финансовых рынках, оказывается не подходящим объектом для статистического исследования. Цены большинства финансовых активов нестационарны – подвержены трендам и «случайным блужданиям». Подробнее об этом можно узнать в статье «Рыночные инварианты». Зато доходность, определяемая как:


PT/P0 - 1 или ln(PT/P0)


(текущая цена, деленная на прошлую цену) значительно более устойчивая величина. Применение статистических методов к доходности уже вполне правомерно. Лучше всего использовать логарифмическую доходность – эта производная цены наиболее подходит для статистического анализа, и ее потом легко обратно преобразовать в цену. Чтобы вас не сбивало с толку само слово «доходность», подчеркну, что она может быть не только положительной (прибыль), но и отрицательной (убыток).


Способы описания

Существует четыре основных способа описания случайной величины: плотность вероятности, функция распределения, квантильная функция и характеристическая функция. Они полностью эквивалентны. Напр., не может быть двух величин с одинаковой плотностью вероятности, но с разными функциями распределения. По этой причине выбор способа описания – вопрос удобства. В большинстве случаев проще работать с плотностями и функциями распределения, но в некоторых ситуациях «на сцену» могут выйти характеристические функции.


Плотность вероятности

Плотность вероятности (probability density function, pdf), пожалуй, наиболее наглядный способ описания случайной величины. Имея историю доходностей, мы можем отсортировать их по интервалам, скажем, 0-1%, 1-2%, 2-3%... и также влево. Подсчитав количество попаданий в эти интервалы, легко построить выборочную гистограмму. На практике это делается при помощи специального софта. Как правило, гистограмма имеет форму колокола с пиком в центре и убывает к «хвостам». Гистограмма показывает вероятность попадания в тот или иной интервал: чем выше столбик гистограммы над каким-либо интервалом, тем чаще встречается доходность, попадающая в этот промежуток. Если вы уловили идею выборочной гистограммы, нетрудно будет понять и концепцию плотности вероятности. Имея огромное количество наблюдений, все больше и больше сужая интервалы, в пределе приходим к плотности вероятности. Это теоретическая кривая, задающая вероятностный закон. Значение pdf в какой-либо точке – это «элемент вероятности» того, что случайная величина примет такое значение. Следует подчеркнуть, что это именно элемент вероятности, а не вероятность, поскольку вероятность того, что непрерывная величина примет какое-то конкретное значение равна нулю. Это может на первый взгляд показаться странным, но на самом деле вполне согласуется с практикой. Нет ничего особенного в цене закрытия акции равной, скажем, 97.42 р., поэтому вероятность того, что она примет ровно такое значение очень маленькая. В теоретической же модели непрерывной цены эта вероятность вообще нулевая. Плотность вероятности удобно использовать при подгонке теоретических законов распределения к выборочным данным. Можно, напр., построить выборочную гистограмму, наложив сверху теоретическую кривую pdf, и визуально оценить точность подгонки.


pdf


На рисунке представлена эмпирическая гистограмма дневных логдоходностей индекса ММВБ с момента расчета по конец 2010 года. Поверх нее наложена кривая плотности вероятности нормального распределения.


Функция распределения

Функция распределения (cumulative distribution function, cdf) – это площадь под кривой плотности вероятности. Математически это интеграл, по этому cdf еще иногда называют интегральной функцией. Функция распределения отвечает на вопрос: какова вероятность того, что случайная величина будет меньше «икс». Напр., пользуясь cdf можно оценить вероятность того, что ожидаемая прибыль окажется меньше, чем 25% годовых, или что убыток превысит 50% и т.п. Как быть если интересует несколько другой вопрос вида: какова вероятность прибыли превысить 25% или убытку быть меньше 50%? Очень просто. Нужно подставить эти цифры в cdf, а потом вычесть из единицы полученную вероятность: 1 - cdf. Как мы убедились, в отличие от плотности вероятности функция распределения имеет дело с настоящими вероятностями, а не с их «элементами», поэтому на практике она имеет большее значение. Математически, однако, как правило, cdf имеет более сложный вид, чем pdf. Часто соответствующие интегралы «не берутся» и приходится находить их численно, но в эпоху современных компьютеров и специализированных статистических программ это, по сути, не проблема. Зная функцию распределения, можно вычислять любые необходимые вероятности. В общем случае это вероятности попадания в какой-либо интервал. Допустим надо вычислить вероятность того, что прибыль окажется в промежутке 25-30%. Для этого надо найти значения функции распределения в двух точках: cdf(0.30) - cdf(0.25). Пользуясь этой формулой, можно отыскать любые мыслимые вероятности.


cdf


На рисунке – функция распределения, соответствующая примеру с индексом ММВБ.


Квантильная функция

Так уж устроена математика: если есть какое-то преобразование, значит, должно быть и обратное. Если есть сложение, то есть и вычитание, если есть умножение, то есть и деление и т.п. Квантильная функция является обратной по отношению к функции распределения. На «вход» квантильной функции дается вероятность, а на «выходе» она возвращает значение случайной величины, соответствующее этой вероятности (квантиль). Рассмотрим пример. Вероятность 0.05 (5%). Квантильная функция выдает цифру -0.25. Это означает, что вероятность убытку превысить 25% равна 5%. Квантильная функция отвечает на вопрос: какая прибыль, не будет превышена с такой-то вероятностью, или какой убыток, будет превышен с такой-то вероятностью? Не трудно сообразить, что это обратная формулировка вопроса, на который отвечает cdf. Практическая значимость квантильной функции велика. В риск-менеджменте она даже получила специальное название – Value-at-Risk (VaR). На русский это можно приблизительно перевести как «стоимость под риском». VaR широко применяется в банковской практике и институциональными инвесторами. Существуют требования и рекомендации для портфелей этих участников рынка, и они сформулированы именно в терминах VaR. VaR дает величину, на которую может снизиться стоимость портфеля при таком-то уровне доверительной вероятности. Проще говоря, напр., 1% дневной VaR, равный 2%, предполагает, что в среднем один раз в сто дней портфель будет терять от 2% и более своей стоимости.


qf


На рисунке – квантильная функция, соответствующая примеру с индексом ММВБ.


Характеристическая функция

Этот способ задания случайной величины наиболее экзотический. Характеристическая функция – это преобразование Фурье (сумма синусоид – элементарных волн) плотности вероятности случайной величины. По большому счету это просто математическая абстракция, не имеющая какого-либо особого вероятностного смысла. Тем не менее, в некоторых случаях эта абстракция оказывается технически очень удобной. Некоторые законы распределения не имеют плотности, которую можно было бы записать в виде какой-то легкой формулы, зато характеристическая функция у них имеет простой вид. Таковы, напр., т.н. «устойчивые распределения» (stable distributions) – очень модная сейчас тема в финансовом риск-менеджменте, поскольку они довольно точно описывают реальные гистограммы доходностей различных активов. Зная характеристическую функцию при помощи обратных преобразований на компьютере можно вычислить и интересующие вероятности. Есть и еще одно полезное свойство характеристической функции. Она позволяет очень просто находить моменты случайных величин: средние, дисперсии (квадрат волатильности), асимметрию и эксцесс. Для этого нужно вычислить первую, вторую и т.д. производные характеристической функции в нуле. Если же работать с pdf, нужно вычислять интегралы. Любой, хоть что-то помнящий из матана, подтвердит, что дифференцирование гораздо проще интегрирования.


Резюме

Из этой лекции мы узнали, что лучше всего работать не с самими ценами, а с доходностями. Фактически это единственный способ делать осмысленные статистические выводы, поскольку только доходности могут являться стационарными величинами. Мы познакомились с основными способами описания доходности как случайной величины. На практике обычно наиболее востребованы первые три из них: pdf, cdf и квантильная функция (обратная cdf), но иногда может быть удобнее и характеристическая функция.


См. также:

Статистика для трейдера. Лекция №0. Введение

Статистика для трейдера. Лекция №2. Обобщенное описание случайной величины. Моменты. Доходность и волатильность. Тренд

Статистика для трейдера. Лекция №3. Операции над случайными величинами. Инвестиционный горизонт. Портфель активов



© q-trader

[обсудить на форуме]


 

Комментарии  

 
0 # Игорь 12.02.2011 03:17
По поводу предпочтения доходности ценам. Как Вы устойчивость определяете? Замена цены на доходности пошла от Фамы, т.к. он писал, что нас интересуют доходности и вывел из их эволюций свою теорию эффективного рынка. Причем, не о всех доходностях он писал а о 5-ти дневных.
Ответить | Ответить с цитатой | Цитировать
 
 
0 # q-trader 12.02.2011 14:10
Устойчивой можно считать величину, у которой хотя бы общая форма выборочной гистограммы не меняется во времени. Цена не стационарна - поэтому ее выборочная гистограмма будет все больше и больше расползаться, чем больший период времени будет рассмотрен. Картинку можно посмотреть здесь: http://q-trading.ru/index.php/articles/money-management/244-rynochnye-invarianty.html

Или можно по другому это показать. Возьмем историю котировок за 2 года. Разделим ее пополам на 2 равные части. Потом построим выборочные гистограммы для каждой половины. Гистограммы цены за 1й год и за 2й будут очень мало походить друг на друга, а вот гистограммы доходности будут иметь по крайней мере похожую форму - с пиком около среднего значения и убывать в хвостах
Ответить | Ответить с цитатой | Цитировать
 

Добавить комментарий


Защитный код
Обновить



© 2010–2012. Все права защищены.
Копирование материалов, размещенных на сайте, разрешается только с рабочей ссылкой на источник.



| О проекте |  Правовая информация |
|  Напишите нам |  Карта сайта |



  

 Новости
главные новости экономики и финансовых рынков: события, мнения, прогнозы.

 Статьи
материалы по теханализу, фундаментальному анализу, управлению капиталом (манименеджмент) и др.

 Рынки
фондовый, валютный, товарный рынки: исторические обзоры, динамика, доходность, корреляции.

 Калькуляторы
xls-калькуляторы для оптимизации размера и структуры торговой позиции; опционные калькуляторы.

 Софт
торговые терминалы, программы для теханализа, оптимизации систем и др.: статьи, обзоры, видеоуроки.

 Архив котировок
индексы, валюты, сырье: многолетние истории котировок в форматах .xls и .txt.

 Индикаторы
ºSiX – индикатор настроения рынка на основе расчета соотношения количества опционных контрактов put и call.

 Библиотека
собрание книг, которые рекомендуется прочесть каждому трейдеру в первую очередь.

 Словарь
толкование основных экономических, финансовых терминов, трейдерский сленг.

 Форум
обсуждение материалов сайта и любых вопросов трейдинга и инвестирования.