Управление рисками в торговле

Глубокое обучение становится все более и более полезным в области автоматизированных финансов и того, как оно влияет на процесс принятия решений, когда речь идет о торговых стратегиях. В двух приведенных ниже статьях мы рассмотрим две разные стратегии, позволяющие сделать автоматическую торговлю более устойчивой к риску при одновременном достижении более высокой отдачи от прибыли, обе из которых используют методы глубокого обучения.

Коэффициент Шарпа

Чтобы понять, как эти два метода глубокого обучения помогают автоматической торговле быть более успешной при контроле риска, нам сначала нужно узнать о коэффициенте Шарпа. Он сравнивает доходность инвестиций с их риском с помощью приведенной ниже формулы.

Определение коэффициента Шарпа

По сути, он измеряет в течение определенного периода времени, как эффективность портфеля при учете его риска сравнивается со стандартным отклонением измеренного рискованного актива. Это будет одним из ключевых факторов оценки в обоих методах, о которых мы сегодня говорим.

Глубокое обучение с подкреплением для автоматической торговли акциями:

В первой статье «Глубокое обучение с подкреплением для автоматизированной торговли акциями» используется метод Маркова процесса принятия решений. Цель этой модели — максимизировать ожидаемую доходность с помощью настройки, как показано ниже:

  • Состояние: [цены на акции, акции акций, остаток на балансе]
  • Действие: [Продажа, Покупка, Владение]
  • Награда: Прямое вознаграждение за совершение действия a в состоянии s и достижение состояния s’
  • Политика: Распределение вероятностей действий при состоянии
  • Q-значение: ожидаемое вознаграждение за принятие мер в соответствии со следующей политикой штата.

При этом модель также учитывает следующие ограничения стековой торговли:

  • Ликвидность рынка
  • Неотрицательный баланс
  • Транзакционные издержки
  • Турбулентность: неприятие риска для обвала рынка

Чтобы учесть факторы, у нас будет следующая функция вознаграждения:

Функция вознаграждения за хранение, продажу и покупку

При обвале рынка модель использует индекс турбулентности, который измеряет экстремальные движения цен на активы. В этом сценарии функция вознаграждения за продажу станет следующей, что указывает на то, что мы хотим свести к минимуму отрицательное изменение стоимости портфеля, продав все принадлежащие акции.

Функция вознаграждения за продажу во время обвала рынка

А вот и часть глубокого обучения: затем мы используем три алгоритма, основанных на актерах-критиках, для создания торгового агента. Затем мы используем стратегию ансамбля, чтобы объединить три агента вместе. Вот три алгоритма:

  • Преимущество актера-критика (A2C):

Он использует функцию преимущества для уменьшения дисперсии градиента политики. Он использует копии одного и того же агента для обновления градиентов с разными образцами данных в одной и той же торговой среде. Затем средний градиент будет передан в глобальную сеть.

  • Градиент глубокой детерминированной политики (DDPG):

Его преимущество перед моделью, предназначенной только для критиков, такой как DQN, заключается в том, что он предназначен для сопоставления состояний с действием, чтобы лучше соответствовать среде пространства непрерывного действия.

  • Ближайшая оптимизация политики (PPO):

Он используется для управления обновлением градиента политики и обеспечения того, чтобы новая политика не слишком отличалась от предыдущей. Таким образом, это повышает стабильность обучения сети политик, ограничивая обновление политики на каждом этапе обучения.

Затем следует стратегия ансамбля: мы будем использовать растущее окно в n месяцев для одновременного переобучения трех агентов, а также проверим агентов с помощью 3-месячной проверки и выберем наиболее эффективного агента с самым высоким коэффициентом Шарпа. Затем мы используем лучшего агента для прогнозирования и торговли на следующий квартал. Результирующее соотношение резкости сверхурочной работы с тремя агентами сведено в таблицу ниже:

Коэффициент Шарпа для трех агентов

В качестве основного измерения, на котором сосредоточено внимание в документе, совокупная доходность с транзакционными издержками показана на графике, как показано ниже:

Мы видим, что стратегия PPO лучше всего подходит для получения большей прибыли, что указывает на то, что она является сильным агентом на бычьем рынке. Предлагаемая ансамблевая стратегия выйдет на второе место по максимизации отдачи.

Если мы также примем во внимание эффективность стратегий во время обвала рынка, основная цель которого — потерять как можно меньше денег, на графике показан результат ниже:

Это показывает, что Min-Variance и DJIA в качестве эталонов не могут минимизировать потери. Стратегия ансамбля в данном случае относительно успешна. Принимая во внимание все остальные соображения, у нас есть диаграмма, как показано ниже:

Оценка эффективности ансамблевого метода и контрольных показателей

Мы видим, что ансамблевая стратегия, возможно, не приносит наибольшей доходности, но имеет самый высокий коэффициент резкости, самую низкую годовую волатильность и минимальный коэффициент риска снижения. Это означает, что ансамблевая стратегия способна достичь удовлетворительной доходности при минимизации риска.

Глубокое обучение для алгоритмической торговли: совершенствование стратегии MACD

Когда глубокое обучение, безусловно, может помочь выбрать лучшую стратегию, оно также может помочь улучшить существующий метод. Во второй статье: «Глубокое обучение для алгоритмической торговли: улучшение стратегии MACD» мы используем остаточные сети для улучшения традиционного торгового алгоритма MACD. Прежде чем мы перейдем к улучшенной версии, мы должны узнать о традиционном алгоритме MACD.

Алгоритм MACD, по сути, дает трейдерам представление о том, когда продавать или покупать, отображая линию MACD с сигнальной линией. Линия MACD создается путем вычитания 26-периодных скользящих средних из 12-периодных скользящих средних, а сигнальная линия представляет собой 9-дневные скользящие средние линии MACD. Трейдеры будут покупать ценную бумагу, когда линия MACD пересекает сигнальную линию, и продавать, когда линия MACD пересекает сигнальную линию.

Синяя линия (MACD) и красная линия (сигнальная линия)

Однако этот метод может привести к ложным срабатываниям. Это означает, что значения, показанные линиями Крузенштерна, могут неточно отражать изменение цены, а некоторые торговые точки слишком плоские и не значимы для торговой доходности. Поскольку существуют транзакционные издержки, как указано в первом документе, мы хотим избежать этих относительно плоских торговых точек, чтобы избежать потенциальных потерь. Вторая статья улучшит это, представив стратегию MACD-KURT.

KURT в MACD-KURT происходит от Kurtosis, который представляет собой информацию, описывающую, насколько резким или плоским является пик распределения данных по сравнению с его хвостами.

xi (цена закрытия акции x в день i) SD (стандартное отклонение акции x цена закрытия в n дней)
  • Эксцесс = 0, что означает близкое к нормальному распределение.
  • Эксцесс > 0, что означает более крутое, чем нормальное распределение
  • Эксцесс < 0, что означает более плоское, чем нормальное распределение.

Поэтому, чтобы убедиться, что торговые точки действительно полезны, мы хотим наблюдать значение эксцесса, превышающее 0. В этой статье мы используем остаточную сеть для прогнозирования значения эксцесса в торговых точках, и мы будем доверять торговому сигналу только там, где эксцесс > 0. Результаты классификации прогнозируемого эксцесса получены из пяти остаточных блоков, как показано ниже. Входные данные будут иметь значение эксцесса каждой акции в течение следующих 14 дней в качестве метки временного ряда.

Затем эксперимент настраивается с использованием трех базовых методов: MLP, FCN и Encoder. Настройка моделей выглядит следующим образом:

Затем мы сравним стратегию MACD-KURT с результатами бэктеста стратегии MACD. Оценка по трем направлениям:

  • Общая доходность
  • Коэффициент Шарпа
  • Максимальная просадка
MACD-KURT показывает лучшие результаты в управлении рисками по сравнению с MACD

Оценивая с помощью базовых методов и остаточной сети, мы получили приведенные ниже результаты эксперимента прогнозируемого эксцесса. Очевидно, что остаточная сеть обладает высочайшей точностью.

Остаточная сеть показывает хорошие результаты по большинству показателей

Кроме того, сравнивая торговые точки со стратегией MACD, мы видим, что торговые точки в основном находятся на одной линии, но оставляют много торговых точек из-за прогнозируемого значения эксцесса.

Во втором документе, по сравнению с первым документом, больше внимания уделяется управлению рисками. Вместо того, чтобы искать лучшие торговые точки, он устраняет торговые точки, чтобы сделать решение менее рискованным. С этой точки зрения методы глубокого обучения могут помочь трейдерам сосредоточиться на получении максимальной прибыли.

Проблемы моделей глубокого обучения

Для анализа торговли акциями наиболее сложным аспектом является глубокий анализ временных рядов. Поскольку объем данных может быть огромным, когда некоторые сделки происходят за миллисекунды с учетом многих факторов окружающей среды, чтобы сделать модели глубокого обучения более эффективными, в двух статьях, рассмотренных выше, разрабатывается собственная стратегия решения проблем.

В работе, использующей ансамблевую стратегию, пространство состояний является 181-мерным с 30 запасами в общей сложности. Включая пространство действий и переход, требования к памяти огромны. Поэтому во время тренировки используется техника нагрузки по требованию.

Обзор метода загрузки по требованию.

В потоке мы видим, что он выбирает пакет для обучения только при запросе данных. Он начинает загружаться только при наличии запроса, и как только значение будет уступлено, загрузка будет приостановлена. Память в это время также будет очищена. Используя эту технику, не будет большого потребления памяти, что обеспечивает большую гибкость при тренировке.

Точно так же в статье, посвященной стратегии MACD-Kurt, выбор остаточной сети обусловлен тем, что, в отличие от традиционных моделей свертки, ResNet имеет короткую остаточную связь между последовательными сверточными слоями. Линейный ярлык (тождество x) свяжет выход остаточных блоков (весовой слой) с его входом (x). Следовательно, градиентный поток будет течь непосредственно через эти соединения, поэтому сеть будет менее сложной из-за уменьшенного эффекта исчезающего градиента.

ResNet

В дополнение к этому, поскольку остаточная сеть уже менее сложна, ее также легче оптимизировать. Добавив больше слоев и глубины, точность увеличится, но не обязательно усложнит модель. Поэтому для глубокого анализа временных рядов остаточные сети являются хорошим выбором.

Ссылка:

  1. Глубокое обучение с подкреплением для автоматизированной торговли акциями: стратегия ансамбля: https://papers.ssrn.com/sol3/papers.cfm?abstract_id=3690996
  2. Глубокое обучение для алгоритмической торговли: улучшение стратегии MACD: https://dl-acm-org.ezproxy.cul.columbia.edu/doi/pdf/10.1145/3404555.3404604
  3. Резкое соотношение: https://www.investopedia.com/terms/s/sharperatio.asp
  4. MACD: https://www.investopedia.com/terms/m/macd.asp

Тестирование моделей рисков на истории

В мире финансов и инвестиций управление рисками является важнейшей составляющей принятия решений. Специалисты по инвестициям, портфельные менеджеры и финансовые учреждения полагаются на модели риска для количественной оценки и управления различными формами риска, связанными с их инвестициями. Эти модели призваны обеспечить всестороннее представление о потенциальных рисках, помогая заинтересованным сторонам принимать обоснованные решения. Однако, как и любой другой аналитический инструмент, модели рисков не идеальны и требуют тщательного тестирования и валидации для обеспечения их эффективности. Как показывает история, ошибка в оценке этой вероятности может иметь критические последствия. Переоценка риска приводит к неправильному использованию ресурсов и снижению конкурентоспособности на рынках, которые, как правило, являются предметом споров между игроками. Недооценка риска может привести к критическим потерям капитала, репутационному ущербу и проблемам с регулированием. Одним из способов избежать таких проблем является тестирование моделей рисков, которое мы рассмотрим в этой статье. Скрипт, разработанный для этой статьи, находится в моем Github.

Что такое модель риска?

Модель риска — это математическая основа или набор статистических методов, используемых для оценки и количественной оценки рисков, связанных с конкретным инвестиционным портфелем, активом или финансовым инструментом. Эти модели могут охватывать широкий спектр типов рисков, включая рыночный риск, кредитный риск, риск ликвидности и многое другое. Основная цель моделей риска заключается в том, чтобы дать представление о потенциальных потерях или колебаниях стоимости, которые инвестиции могут испытывать при различных рыночных условиях.

Распространенные типы моделей риска:

  1. Исторические модели: Расчет риска на основе статистических показателей поведения рынка в прошлом.
  2. Стресс-модели: Оцените, как портфель будет работать в экстремальных рыночных условиях, часто выходящих за рамки исторических данных.
  3. Моделирование по методу Монте-Карло: использование случайных величин для моделирования различных рыночных сценариев и оценки риска портфеля.

Зачем нужно тестирование на истории

Общая черта всех моделей риска заключается в том, что они требуют разработки допущений и параметров. Если эти допущения и параметры не подобраны с умом, то даже отличная модель будет давать бесполезную информацию. Тестирование на истории является важным этапом в оценке надежности и эффективности модели риска. Этот процесс включает в себя сравнение прогнозов модели с фактическими результатами, наблюдаемыми в течение исторического периода. Таким образом, вы можете определить, обеспечивает ли модель риска точную оценку риска и может ли она эффективно направлять инвестиционные решения. Вот несколько причин, по которым тестирование на истории важно:

  1. Проверка модели: тестирование на истории помогает подтвердить, насколько точно модель отражает основные факторы риска, динамику рынка и финансовые инструменты. Это гарантирует, что модель является достоверным представлением реальности и может быть использована для снижения рисков.
  2. Непрерывное совершенствование: сравнивая прогнозы модели с фактическими результатами, можно оценить эффективность модели в различных рыночных условиях. Это позволяет вносить улучшения и корректировки для повышения точности.
  3. Соответствие нормативным требованиям: Многие финансовые нормативные акты и отраслевые стандарты требуют от учреждений тестирования своих моделей управления рисками, чтобы убедиться, что они соответствуют конкретным стандартам и пороговым значениям и избегают системных рисков.

Как это сделать?

Давайте проведем небольшое исследование на примере валютной пары USD/BRL. На графике ниже представлен его обменный курс на момент закрытия с 2015 года по ноябрь 2023 года.

Исходя из цен, мы можем рассчитать дневную доходность и отобразить ее на графике ниже.

Одним из наиболее распространенных подходов к моделированию рыночного риска является расчет стоимости под риском (VaR) с использованием экспоненциально-взвешенной скользящей средней (EWMA) доходности. Этот метод был предложен известной компанией J.P. Morgan’s и Reuters’ RiskMetrics в 1996 году и с тех пор широко используется.

Волатильность, предлагаемая этой моделью, является рекурсивной функцией, вычисляемой как:

Извлечено из отчета RiskMetrics (Ссылка)

где сигма — волатильность, лямбда — коэффициент затухания, а r — доходность актива. На графиках ниже показано влияние различных коэффициентов затухания на весовые коэффициенты последних точек данных.

Весовые коэффициенты последних точек данных в соответствии с различными коэффициентами распада. Извлечено из отчета RiskMetrics (Ссылка)
Связь между коэффициентом затухания и количеством точек данных, используемых в модели. Извлечено из отчета RiskMetrics (Ссылка)

Мы знаем, что это надежная и действенная модель для многих активов, но с таким количеством других хороших вариантов, как узнать, является ли это хорошим коллом для пары USD/BRL? Кроме того, как показано в исследовании, параметризация коэффициента распада модели имеет важное значение для ее адекватных прогнозов. Небольшой коэффициент затухания сделает модель слишком отзывчивой к краткосрочным данным, а большой затухание сделает ее вообще невосприимчивой, так как же определить подходящее значение для этого актива? Здесь полезно тестирование на истории.

Value at Risk (VaR) рассчитывается на основе полученной волатильности с использованием распределения Z-score на основе желаемого уровня достоверности. Например, рассматривая двустороннюю ситуацию (где мы можем держать как длинные, так и короткие позиции), соответствующая Z-оценка для уровня достоверности 95% будет получена из 97,5% процентиля, оставшиеся 2,5% для каждой стороны распределения доходности. Это означает, что при тщательном проектировании нашей модели вероятность того, что доходность выпадет из расчетного VaR, составит 5%. Но использование Z-оценок подразумевает в фундаментальном предположении, что распределение доходности является нормальным. Поэтому, прежде чем двигаться дальше, давайте сравним распределение доходности USD/BRL с нормальным распределением на гистограмме.

При визуальном осмотре они выглядят очень похожими, поэтому мы сделаем еще один шаг вперед и применим статистический критерий Шапиро-Уилка для определения нормальности.

Полученная тестовая статистика и p-значение позволяют считать обратное распределение нормальным, а значит, у нас есть зеленый свет для продолжения оценки VaR. Мы рассчитаем EWMA, применяя коэффициент затухания, равный 0,94, и используем 90% доверительную вероятность для оценки VaR. Результаты представлены на графике ниже.

Как мы видим, область между границами VaR составляет большую часть дневной доходности, а некоторые экстремальные события выпадают из расчетных диапазонов. Чтобы узнать, являются ли эта модель и коэффициент затухания адекватными для данного актива, мы должны проверить, эквивалентно ли возникновение таких событий 10%, как мы определили в нашем уровне достоверности. Подсчитав процент событий, мы видим, что после необходимого периода стабилизации ошибка оценки близка к 10% как в расширяющемся, так и в скользящем окнах.

Это хорошая новость, которая показывает хорошую валидность модели EWMA VaR для пары USD/BRL. Но зачем выбирать такую сложную модель? Что, если мы просто возьмем исторический процентиль доходности, чтобы оценить наш VaR? На рисунке ниже показан расчетный исторический VaR с использованием уровня достоверности 90% для 3-летнего окна. Как мы видим, это гораздо более статичная метрика, чем предыдущая.

Давайте проверим работоспособность обоих методов на рисунке ниже

Взглянув на результаты, мы видим, что даже после необходимого периода стабилизации процентная погрешность отличается от ожидаемых 10%. Как расширяющееся, так и скользящее окна представляют значения, которые колеблются гораздо сильнее, чем ошибка EWMA. В большинстве окон простой исторический VaR либо переоценивал, либо недооценивал риск больше, чем метод EWMA VaR.

На этом мы остановимся, но, конечно, это только начало. Для того, чтобы правильно реализовать модель риска, мы должны провести масштабные подобные исследования, чтобы убедиться, что будущие сценарии максимально охвачены.

Заключение

Тестирование моделей рисков на истории является важнейшим компонентом эффективного управления рисками в финансовой отрасли. Это помогает нам проверять и сравнивать надежность различных моделей при прогнозировании и управлении различными формами риска. Проводя тщательное тестирование, специалисты по инвестициям и финансовые учреждения могут принимать более обоснованные решения и лучше защищать свои активы и инвестиции. Важно помнить о потенциальных последствиях переоценки или недооценки риска в моделях рисков и использовать их как часть более широкой системы управления рисками. Достижение правильного баланса в оценке рисков имеет решающее значение для достижения инвестиционных целей при одновременном снижении потенциальных потерь.

Источник

Источник