Главная Статьи Управление капиталом Статистика для трейдера. Лекция №4. Основные законы распределения случайных величин
Статистика для трейдера. Лекция №4. Основные законы распределения случайных величин
26.03.2012 09:00

В этой лекции мы познакомимся с наиболее базовыми законами распределения случайных величин, которые могут оказаться полезными для трейдера или инвестора в его торговой практике. Существует бесконечное количество кривых, которые могут быть плотностью вероятности какой-либо случайной величины. Для этого должны соблюдаться только два условия: кривая должна быть неотрицательной в любой точке графика, а площадь под ней – равняться единице. На практике нет никакой возможности изучить целую «вселенную» таких кривых, поэтому, как правило, используются всего несколько основных законов – о некоторых из них и пойдет речь далее.


Параметры распределения

Типичный закон распределения представляет собой некоторую формулу. Переменные величины, которые можно в нее подставлять называют параметрами и часто обозначают греческими буквами. Как правило, число параметров не превышает четырех, а в распределениях, с которыми мы познакомимся в этом курсе лекций, оно не будет превышать трех. Параметр локализации обычно отвечает за горизонтальное положение кривой плотности вероятности относительно нуля. Параметр шкалы задает разброс значений относительно центра. Еще один параметр связан с толщиной хвостов распределения (эксцесс): чем толще хвосты, тем выше вероятность экстремальных событий, таких как обвалы цен. Кроме того, некоторые распределения имеют параметр, отвечающий за асимметрию плотности относительно среднего значения. Как правило, логдоходности большинства финансовых инструментов не демонстрируют резкой асимметрии, поэтому в данном базовом курсе мы такие распределения рассматривать не будем.


Все распределения делятся на два типа: дискретные и непрерывные. Дискретные моделируют системы, состояния которых можно пронумеровать натуральными числами: 0, 1, 2, 3… Напр., закон вероятности, описывающий количество тиков в торговой сессии, – дискретный, а доходности какого-либо актива – непрерывный, так как доходность может принимать практически любые дробные значения.

Далее в тексте будут использоваться следующие сокращения: PDF – функция плотности вероятности, PMF – функция массы вероятности (дискретный аналог PDF), CDF – кумулятивная функция распределения (интеграл PDF или сумма PMF от наименьшего значения до некоторого x).


Биноминальное распределение

PMF: n!/m!/(n-m)! pm (1 - p)n-m

Exсel: БИНОМРАСП(m;n;p;0)

Matlab: binopdf(m,n,p)


CDF: Β1-p(n - m, 1 + m),

где Β – регуляризованная неполная бета-функция

Exсel: БИНОМРАСП(m;n;p;1)

Matlab: binocdf(m,n,p)


Среднее значение: np

Стандартное отклонение: [np(1 - p)]½


Это один из простейших дискретных законов. Предположим, что вероятность прибыльной сделки для некоторой торговой системы равна 60%. При таком раскладе даже чисто интуитивно можно ожидать 60 прибыльных сделок в серии из 100. Однако может и не повезти, и реальное число прибыльных трейдов окажется меньше. Находить вероятности таких событий можно при помощи биноминального распределения. Давайте, к примеру, вычислим вероятность выпадения только 50 прибыльных сделок в 100. Для этого воспользуемся формулой для PMF и получим 1.03%. Это довольно маленькая цифра, поскольку она представляет собой вероятность отдельного исхода. Чтобы найти вероятность полного спектра сценариев, когда число прибыльных сделок в серии оказывается меньше или равно 50: 50, 49, 48 и т.д., надо использовать CDF. В этом случае получаем 2.71%. Как видно, вероятность для целого сценарного спектра существенно больше.

Биноминальное распределение очень полезно, когда нужно оценить значимость отклонения какого-либо явления от равномерной схемы 50/50. Напр., вы узнаете, что некий управляющий за период в 10 лет смог в 7 годах получить доходность лучше рынка. Насколько вероятно, что у него действительно есть талант к отбору бумаг и т.п. вещам, или же этот результат – просто случайное отклонение? Для этого надо оценить вероятность выпадения 7 и более успехов в серии из 10 испытаний с вероятностью успеха 50% (один из вариантов т.н. «схемы Бернулли»). Используя CDF, мы можем найти вероятность выпадения 7 и менее успехов. 1 – CDF дает нам вероятность более 7 успехов, поэтому, чтобы учесть 7, в формулу для CDF надо подставлять n - 1, т.е. 6 в нашем случае. В итоге получаем 17.19%. Значит, вероятность чисто случайного получения такого хорошего результата довольно высока. В статистике обычно минимальным уровнем значимости считается 5%, поэтому гипотезу о наличии у управляющего особых способностей следует отбросить. Более того, даже при 8 удачных годах, вероятность случайного результата все еще довольно высока – 5.47%. При такой малой выборке говорить об устойчивости результатов можно лишь при 9-10 успехах.


Геометрическое распределение

PMF: p(1 - p)n-1

Matlab: geopdf(n-1,p)


CDF: 1 - (1 - p)n

Matlab: geocdf(n-1,p)


Среднее значение: 1/p

Стандартное отклонение: (1 - p)½/p


Этот закон позволяет вычислить вероятность успеха на определенном шаге испытания. Так, если вероятность прибыльной сделки торговой системы равна 60%, можно вычислить вероятность того, что успех наступит в первой же сделке или во второй, третьей и так далее. Нетрудно убедится, что наиболее вероятным является достижение успеха в первой же сделке, причем этот факт не зависит от самой вероятности успеха. Однако для хорошей системы эта вероятность будет высока, напр., 60%, а для плохой – низка, напр., 50% и меньше. С увеличением числа сделок вероятность получить хотя бы одну прибыльную приближается к единице. Напр., для нашей системы успех с вероятностью 99% будет достигнут не более чем за 5 сделок, в чем можно убедиться, использовав формулу для CDF. Для сравнения системе с 40% вероятностью успеха потребовалось бы 9 шагов, что бы с такой же надежностью добиться успеха.

Геометрическое распределение существует так же и в другом варианте. Если кого-то интересует вероятность количества убыточных сделок до первой прибыльной, он тоже может воспользоваться геометрическим распределением, только вместо n в формулы для PMF и CDF подставлять n+1. Получится соответственно: p(1 - p)n и 1 - (1 - p)n+1. Среднее же значение будет равно среднему количеству шагов до успеха минус единица.


Распределение Пуассона

PMF: exp(-λ) λn/n!

Exсel: ПУАССОН(n;λ;0)

Matlab: poisspdf(n,λ)


CDF: Г(n + 1, λ)/n!,

где Г – неполная гамма-функция.

Exсel: ПУАССОН(n;λ;1)

Matlab: poisscdf(n,λ)


Среднее значение: λ

Стандартное отклонение: λ½


Это распределение еще иногда называют законом редких событий. В трейдинге его (и более сложные случайные процессы, основанные на законе Пуассона) можно применять для моделирования микроструктуры рынка, а значит, оно потенциально может быть интересным для скальперов и высокочастотников. Допустим, трейдер собрал статистику количества сделок (тиков) в первый утренний час торговой сессии по какому-либо инструменту. Оказалось, что в среднем бывает 100 тиков. Какова вероятность, что количество сделок окажется не более 80? Для этого воспользуемся функцией CDF Excel или Matlab и получим ответ: 2.26%, т.е. весьма маленькая. Соответственно вероятность того, что будет более 80 тиков, составит: 100% - 2.26% = 97.74%.


Экспоненциальное распределение

PDF: λexp(-λt)

Exсel: ЭКСПРАСП(t;λ;0)

Matlab: exppdf(t,1/λ)


CDF: 1 - exp(-λt)

Exсel: ЭКСПРАСП(t;λ;1)

Matlab: expсdf(t,1/λ)


Среднее значение: 1/λ

Стандартное отклонение: 1/λ


Это, пожалуй, простейший непрерывный закон. Его можно использовать для моделирования неотрицательных случайных величин. Плотность вероятности экспоненциального распределения представляет собой убывающую кривую с пиком в нуле. Экспоненциальное распределение самым непосредственным образом связано с законом Пуассона. Если взять пример с количеством тиков, то экспоненциальное распределение будет моделировать промежутки времени между тиками. Так, при средней интенсивности 100 тиков в час типичный промежуток времени между сделками (среднее значение) в торговой системе составит 1/100 часа или 36 секунд. Какова вероятность, что время ожидания до следующей сделки не превысит 50 секунд? Сначала переведем секунды в доли часа, поскольку в качестве временного базиса мы использовали часы. В часе 3600 секунд, значит, 50 секунд – это примерно 0.0139 часа. Подставим эту цифру наряду с λ = 100 в формулу для CDF и получим 75.09%. Это означает, что с вероятностью 75.09% следующая сделка произойдет в течении 50 секунд, соответственно вероятность ожидания более 50 секунд составит 100% - 75.09% = 24.91%.


Равномерное распределение

PDF: 1/(b - a)

Matlab: unifpdf(x,a,b)


CDF: (x - a)/(b - a)

Matlab: unifcdf(x,a,b)


Среднее значение: (a + b)/2

Стандартное отклонение: (b - a)/12½


Название говорит само за себя. Плотность вероятности этого распределения – горизонтальная прямая от a до b, поскольку все события равновероятны. Несмотря на свою простоту, это распределение является одним из важнейших. Так, если у нас есть генератор стандартной равномерно распределенной величины (Excel: СЛУЧМЕЖДУ(0;1)), при его помощи можно моделировать любые другие случайные величины. Для этого надо лишь пропустить сгенерированные случайные числа через квантильную функцию (обратная CDF) желаемого закона распределения. Если моделируя методом Монте-Карло, вы захотите использовать какое-то распределение, для которого у вас нет датчика случайных чисел, вы легко сможете использовать для этой цели стандартный датчик для равномерного распределения.


Нормальное распределение

PDF: exp[-(x - µ)2/2/σ2]/σ/(2π)½

Exсel: НОРМРАСП(x;µ;σ;0)

Matlab: normpdf(x,µ,σ)


CDF: {1 + erf[(x - µ)/σ/2½]}/2

Exсel: НОРМРАСП(x;µ;σ;1)

Matlab: normcdf(x,µ,σ)


Среднее значение: µ

Стандартное отклонение: σ

Нормальное распределение и связанное с ним логнормальное очень популярны в классической теории финансовых рынков. Они применяются для моделирования доходностей рисковых активов, таких как, напр., акции или валюты, распределения цены опционных контрактов и т.д. Считается, что на длинных временных интервалах – квартальных, годовых и т.д. «свечках» распределение реальных логдоходностей довольно неплохо приближается нормальным распределением. Несмотря на всю критику, нормальное распределение по-прежнему является очень важным в финансовой практике и заслуживает более подробного рассмотрения в отдельной лекции. Здесь же пока приводится лишь самая краткая информация. Нормальное распределение характеризуется всего двумя параметрами: µ и σ – среднее и стандартное отклонение или на финансовом языке – доходность и волатильность. Параметр µ задает центр распределения (максимум кривой PDF), а σ – типичный разброс значений вокруг него. Нормальное распределение можно применять для моделирования логдоходностей.


Логнормальное распределение

PDF: exp[-(ln x - µ)2/2/σ2]/x/σ/(2π)½

Exсel: ЛОГНОРМРАСП(x;µ;σ;0)

Matlab: lognpdf(x,µ,σ)


CDF: {1 + erf[(ln x - µ)/σ/2½]}/2

Exсel: ЛОГНОРМРАСП(x;µ;σ;1)

Matlab: logncdf(x,µ,σ)


Среднее значение: exp(µ + σ2/2)

Стандартное отклонение: {[exp(σ2) - 1]exp(2µ + σ2)}½

Логнормальное распределение следует применять для описания обычных доходностей (вернее говоря, темпов роста цены – C/O = ДОХОДНОСТЬ + 1). В отличие от нормального оно ограничено нулем, что согласуется с тем фактом, что цена не может быть отрицательной величиной. По сути это одно и то же распределение связанное логарифмическим преобразованием доходностей, что выражается в большой схожести формул. Параметр µ для логнормального распределения является средним логарифмическим, т.е. средней логдоходностью, а σ – ее волатильностью. Выражение exp(µ) дает среднее геометрическое, т.е. реальный процентный рост актива.


Выводы

Итак, в этой лекции мы познакомились с основными, наиболее простыми законами распределения случайных величин и узнали как их можно использовать на практике. Приведенные примеры применения не являются исчерпывающими. Здесь главное уметь переводить те или иные торговые ситуации на язык математической статистики. Как только вы сформулировали положение в терминах той или иной вероятностной схемы (вроде количества выпадений орлов и решек для биноминального закона), вы можете смело применять арсенал матстата к вашей задаче.



© q-trader

[обсудить на форуме]


 

Комментарии  

 
-1 # Константин 05.08.2013 16:28
В геометрическом распределении приводится пример со сделками что с увеличением количества сделок вероятность получить хотя бы одну прибыльную стремится к 1... на самом деле это не так, будущее в трейдинге не зависит от прошлого, вероятность как была 60/40 так она и осталась.
Ответить | Ответить с цитатой | Цитировать
 
 
0 # q-trader 10.09.2013 21:32
Это чисто модельный пример. На практике истинная вероятность успеха нам не известна. А тут предполагается, что она каким-то образом известна. В такой ситуации вероятность получить, хотя бы одну прибыльную сделку растет со временем. И даже в ситуации 50х50 она растет. Но это не есть зависимость от прошлого. Т.е. если десять раз выпала решка это не означает, что на 11-й раз повышенная вероятность выпадения орла. УСЛОВНАЯ ВЕРОЯТНОСТЬ всегда 50%. А вот вероятность успеха (орла) растет, но она безусловная - и орел может выпасть на любом шаге от 1 до N. Т.е. это разные кусочки вероятностного пространства
Ответить | Ответить с цитатой | Цитировать
 

Добавить комментарий


Защитный код
Обновить



© 2010–2012. Все права защищены.
Копирование материалов, размещенных на сайте, разрешается только с рабочей ссылкой на источник.



| О проекте |  Правовая информация |
|  Напишите нам |  Карта сайта |



  

 Новости
главные новости экономики и финансовых рынков: события, мнения, прогнозы.

 Статьи
материалы по теханализу, фундаментальному анализу, управлению капиталом (манименеджмент) и др.

 Рынки
фондовый, валютный, товарный рынки: исторические обзоры, динамика, доходность, корреляции.

 Калькуляторы
xls-калькуляторы для оптимизации размера и структуры торговой позиции; опционные калькуляторы.

 Софт
торговые терминалы, программы для теханализа, оптимизации систем и др.: статьи, обзоры, видеоуроки.

 Архив котировок
индексы, валюты, сырье: многолетние истории котировок в форматах .xls и .txt.

 Индикаторы
ºSiX – индикатор настроения рынка на основе расчета соотношения количества опционных контрактов put и call.

 Библиотека
собрание книг, которые рекомендуется прочесть каждому трейдеру в первую очередь.

 Словарь
толкование основных экономических, финансовых терминов, трейдерский сленг.

 Форум
обсуждение материалов сайта и любых вопросов трейдинга и инвестирования.