Руководство по алгоритмической торговле криптовалютой

Эта статья была первоначально написана советником Amentum Кевином Чжоу (Twitter) в их блоге.

В этой статье мы исследуем разработку и реализацию торговых алгоритмов в криптопространстве. В частности, мы фокусируемся на алгоритмах исполнения, алгоритмах маркет-мейкинга и нескольких соображениях микроструктуры рынка. Мы также исследуем, где практика расходится с теорией, особенно в том, что касается особенностей криптовалютных рынков.

Алгоритмы исполнения

Цель алгоритма исполнения состоит в том, чтобы перевести состояние портфеля в другое, минимизируя при этом затраты. Например, если вы хотите увеличить свою экспозицию BTCUSD на 1000, вы, возможно, не захотите мгновенно вводить рыночный ордер в книгу BitMEX, что приведет к значительному проскальзыванию. Вместо этого вы можете подумать о том, чтобы медленно входить в желаемую позицию с течением времени с помощью комбинации рыночных и лимитных ордеров на нескольких различных биржах.

Алгоритм исполнения обычно имеет 3 уровня: макротрейдер, микротрейдер и интеллектуальный маршрутизатор.

Слой макротрейдера разбивает большой мета-ордер или родительский ордер на более мелкие дочерние ордера, распределенные во времени. По сути, это часть планирования всего алгоритма. VWAPTWAP и POVявляются распространенными и простыми примерами алгоритмов макротрейдера. Как правило, существует множество различных моделей воздействия на рынок, которые можно использовать при разработке сложного слоя макротрейдера. Модели влияния на рынок смотрят на то, как рынок реагирует на исполнение. Остается ли рынок там, где он есть, после исполнения? Или он отдаляется? Или это возвращается в какой-то степени? Двумя наиболее плодотворными моделями воздействия на рынок являются модель постоянного воздействия на рынок Альмгрен-Крисс (1999, 2000) и модель переходного воздействия на рынок Обижаевой-Ван (2013). Учитывая, что на практике влияние рынка не является постоянным, Обижаева-Ван, кажется, лучше совпадает с реальностью. С тех пор было разработано много новых моделей для устранения его недостатков.

Уровень микротрейдера решает для каждого дочернего ордера, исполнять ли его как рыночный ордер или лимитный ордер, а если как лимитный ордер, то какую цену следует указать. Гораздо меньше литературы существует по дизайну микротрейдеров. Это связано с тем, что размер дочернего ордера обычно составляет такую маленькую часть всего рынка, что на самом деле не имеет значения, как вы его выполняете. Однако криптовалюта отличается, поскольку ликвидность очень тонкая, а проскальзывание на практике является значительным даже для дочерних ордеров обычного размера. Дизайн микротрейдера обычно фокусируется на распределении поступления ордеров по времени и глубине, позиции очереди и другим особенностям микроструктуры рынка. Рыночные ордера (и кросс-лимитные ордера, если мы игнорируем задержку) гарантируют исполнение, в то время как остальные лимитные ордера не имеют таких гарантий. Если исполнение не гарантировано, вы рискуете отстать от графика, установленного макротрейдером.

Уровень интеллектуального маршрутизатора решает, как направлять выполнение на разные биржи/площадки. Например, если Kraken имеет 60% ликвидности, а GDAX (Coinbase Pro / Prime) имеет 40% ликвидности до заданного уровня цен, то любой рыночный ордер, принятый микротрейдером, должен быть направлен 60-40 в Kraken-GDAX. Теперь вы можете привести аргумент, что арбитры и маркет-мейкеры на рынке будут переносить ликвидность с одной биржи на другую, поэтому, если вы выполните половину своего ордера на Kraken и подождете несколько секунд, часть этой ликвидности пополнится от вилочников и статистов, перемещающихся через ликвидность GDAX в Kraken, и вы сможете сделать остальное по аналогичной цене. Однако даже в этом случае вилочник будет взимать с вас дополнительную плату за свою прибыль, а также перекладывать на себя собственные расходы на хеджирование, такие как комиссия производителя Kraken. Более того, некоторые участники рынка публикуют больше, чем они хотят, на нескольких площадках и стремятся отменить избыточный размер, как только они будут достигнуты. В конечном счете, лучше всего иметь собственную интеллектуальную маршрутизацию. Встроенная интеллектуальная маршрутизация также имеет преимущество в задержке по сравнению со сторонними службами интеллектуальной маршрутизации. В первом случае вы можете направлять напрямую на биржи, а во втором случае вам сначала нужно отправить сообщение стороннему сервису, а затем они направят ваш заказ на биржи (плюс вы должны заплатить третьей стороне комиссию за маршрутизацию). Сумма любых двух катетов треугольникабольше, чем третий катет.

Алгоритмы маркет-мейкинга

Маркет-мейкинг заключается в предоставлении немедленной ликвидности другим участникам и получении за это компенсации. Вы берете на себя риск запасов в обмен на положительную ожидаемую стоимость. В конечном счете, маркет-мейкер получает компенсацию по двум причинам. Во-первых, покупатели рынка имеют высокие временные предпочтения и хотят немедленности. Маркет-мейкеры, которые облегчают ликвидность покупателям, в свою очередь, получают компенсацию за свои меньшие временные предпочтения и терпение. Во-вторых, профиль PnL маркет-мейкера имеет левый перекос, и, как правило, большинство людей предпочитают правый перекос. Другими словами, маркет-мейкеры являются аналогом букмекеров на рынках ставок, казино, страховых компаний и государственных лотерей. Они часто выигрывают в маленьком и редко проигрывают в большом. В обмен на принятие этого нежелательного профиля доходности маркет-мейкеры получают компенсацию в виде ожидаемой стоимости.

На высоком уровне лимитные ордера — это бесплатные опционы, выписанные на остальную часть рынка. Остальная часть рынка имеет право, но не обязана, покупать или продавать актив по лимитной цене лимитного ордера. На прекрасно информированном рынке никто не будет продавать бесплатные опционы. Только потому, что рынок в совокупности не совсем информирован, никогда не имеет смысла продавать бесплатные опционы. С другой стороны, если бы рынок был совершенно не информирован, нейтральный к риску маркет-мейкер был бы готов продать эти бесплатные опционы на лимитные ордера даже с бесконечно малым спредом, поскольку вся торговля — это шум. Очевидно, что на реальных рынках есть множество участников, каждый из которых обладает уникальным уровнем информированности.

При разработке алгоритма маркет-мейкинга необходимо учитывать три точки зрения: маркет-мейкера, маркет-тейкеров и других маркет-мейкеров.

Собственная точка зрения маркет-мейкера представлена их инвентарем. Если у вас уже слишком много активов, вы, вероятно, наклоните/перекосите свои котировки вниз и наоборот из-за слишком малого риска активов. Вы делаете это по двум причинам. Во-первых, как фирма, у вас есть некоторый уровень неприятия риска (вероятно, меньше, чем у физического лица, но ваша полезность для денег все еще вогнута). Существует множество конструкций для формы этой функции полезности (например, CARA, CRRA, в более общем смысле HARA и т. Д.). Во-вторых, как пассивный поставщик ликвидности на рынке, вы подвержены риску неблагоприятного отбора. Активные покупатели ликвидности могут знать что-то, чего не знаете вы, или просто быть умнее вас. По сути, это проблема продажи бесплатных опционов на рынок. Кроме того, даже на механическом уровне рыночный ордер, который попадает в вашу ставку, снижает цену по рыночной цене, в то время как рыночный ордер, поднимающий ваше предложение, поднимает цену по рыночной цене. В момент любой сделки вы всегда находитесь не на той стороне. Кроме того, котировки маркет-мейкера создают пассивное влияние на рынок. Другими словами, акт размещения заказа в книге имеет, по крайней мере, небольшой эффект отведения рынка от вас.

Перспективы маркет-тейкеров представлены потоком заказов. Взвешенная по объему частота поступления заказов в зависимости от глубины от верхней части книги должна иметь несколько ключевых свойств. Функция должна быть 1) убывающей, 2) выпуклой (интуицию здесь трудно объяснить, но это однозначно имеет место эмпирически), 3) асимптотически приближающейся к 0 по мере того, как глубина становится бесконечной. Некоторые формулировкитребуют, чтобы эта функция интенсивностибыла непрерывно дважды дифференцируемой для управляемости, что является прекрасным и разумным предположением, но в конечном итоге также не нужным. Кроме того, существуют различные формулировки того, как рассчитать «глубину или расстояние от верхней части книги». Как правило, вы можете использовать либо «справедливую среднюю цену», либо лучшую ставку и лучшее предложение для каждой соответствующей стороны. Между этими двумя подходами существуют различные компромиссы, которые мы здесь не будем рассматривать. И помимо этого, все еще есть кроличья нора, чтобы понять, какой должна быть «справедливая средняя цена». Чтобы добавить здесь немного красок, средняя цена, равноудаленная между лучшей ставкой и лучшим предложением, подвержена шуму, когда заказы на пыль публикуются и отменяются. Кроме того, учитывая два футляра с одинаковой формой книги, последний оттиск по лучшей цене предполагает более низкую справедливую цену, чем последний оттиск по лучшему предложению. И есть еще один вопрос: имеет ли значение история гравюр, и если да, то должны ли мы смотреть на нее с точки зрения времени часов или объема? Так где же оптимальное размещение лимитного ордера для маркет-мейкера с учетом особенностей потока на рынке? Если вы разместите сжатые цитаты в верхней части книги, вы будете часто заполняться, но каждый раз зарабатывать очень мало. Если вы публикуете глубокие кавычки, вы будете заполняться реже, но делать «больше» каждый раз, когда вы это делаете. По сути, это выпуклая задача оптимизации с уникальным глобальным максимумом. Еще одним соображением является прибытие потока заказов во времени, что немного похоже на процесс Пуассона. Некоторые предполагают, что это ближе к процессу Хоукса. Более того, отскок спроса и предложения, который пытается зафиксировать маркет-мейкер, является краткосрочной версией возврата к среднему. Поскольку этот ультракраткосрочный возврат к среднему масштабируется локальной волатильностью, маркет-мейкерам имеет смысл расширять свои котировки при высоком объеме и ужесточать котировки при низком объеме.

Взгляды других маркет-мейкеров представлены в книге. Книга раскрывает некоторую частную информацию других маркет-мейкеров. Больше предложений, чем заявок в верхней части книги, говорит о том, что другие производители более охотно продают, чем покупают актив. Вполне возможно, что у этих производителей уже есть большие положительные дисбалансы в запасах или они просто считают, что цена, скорее всего, пойдет вниз, чем вверх в краткосрочной перспективе. В любом случае вы, как маркет-мейкер, можете корректировать свои котировки в зависимости от перекоса книги. Более того, когда маркетмейкеры конкурируют друг с другом, если размер тика небольшой, вы часто видите такое поведение «копеечного прыжка». Маркет-мейкеры соревнуются за приоритет заполнения, прыгая друг на друга и поднимаясь по лестнице до тех пор, пока не будет достигнута некоторая точка капитуляции и не будет единственного «победителя» за приоритет заполнения. После того, как победитель был определен, занявший второе место часто опускается до одного тика перед следующей лучшей ставкой или предложением. Если вы потеряли приоритет заполнения, вы также можете получить второй приоритет заполнения и заплатить за него ровно столько, сколько нужно. Это вызывает регресс, в результате которого победитель теперь падает на один тик перед занявшим второе место, и игра в ладдере возобновляется. Вы можете увидеть эту игру с лестницей в реальных данных крипторынка.

Наконец, долгосрочные направленные сигналы могут быть наложены на алгоритмы маркет-мейкинга, где цель алгоритма маркет-мейкинга больше не состоит в том, чтобы поддерживать запасы на плоском или постоянном уровне, а в том, чтобы иметь в виду некоторую долгосрочную цель и соответствующий перекос, чтобы это произошло.

Скорость

Есть две основные причины, по которым скорость имеет значение. Во-первых, вы можете попасть в ордера, находящиеся в книге заказов, прежде чем они будут отменены. Во-вторых, вы можете отменить ордера, находящиеся в книге заказов, до того, как они будут выполнены. Другими словами, вы хотите отбирать устаревшие заказы и не хотите, чтобы ваши заказы были удалены. Алгоритмы арбитража (активные) и алгоритмы исполнения (активные) больше заботятся о первом, в то время как алгоритмы маркет-мейкинга (пассивные) больше заботятся о втором.

Как правило, стратегии, которые больше всего выигрывают от скорости, являются самыми базовыми. Любая сложная логика обязательно замедлит время приема-передачи. Эти типы алгоритмических стратегий являются автомобилями F1 в мире торговли. Проверка данных, проверки безопасности, контрольно-измерительные приборыоркестровка и т. д. могут быть удалены в пользу скорости. Пропустите OMSEMS и PMS (систему управления портфелем) и напрямую подключите вычислительную логику на своих графических процессорах к двоичному API совмещенной биржи. Быстрая и опасная игра.

Другой класс стратегий, чувствительных к скорости, релятивистские стратегии статистического арбитража, серверы, которые должны быть физически расположены между несколькими биржами, а не совмещены с одной биржей. Хотя они не будут самыми быстрыми для получения данных с любого отдельного обмена, они будут получать и могут действовать на основе данных о корреляции и коинтеграции до любой другой стратегии.

В скоростной игре победитель получает больше всего. В простейшем примере, если существует возможность арбитража, тот, кто сможет добраться до нее первым, будет претендовать на прибыль. Второе место получает крохи, а третье место не получает ничего. Выплаты, скорее всего, распределены по степенному закону.

Скоростная игра – это тоже гонка на дно. Как только все перейдут от волоконной оптики к микроволновым / лазерным сетям, все вернутся на равные условия, и любое первоначальное преимущество будет превращено в товар.

Размер тика, приоритет заполнения и позиция очереди

Большинство механизмов сопоставления подчиняются приоритету цена-время (пропорциональное сопоставление является менее распространенной альтернативой, но мы пока не рассматриваем их). Лимитные ордера по лучшим ценам исполняются до лимитных ордеров по худшим ценам. Для лимитных ордеров по той же цене ордера, размещенные ранее, исполняются раньше, чем ордера, размещенные позже.

Binance дискретизирует свои книги заказов максимум до 8 знаков после запятой. Если символ имеет цену .000001, тик .00000001 составляет 1% от цены. Если символ имеет цену 0,0001, тик 0,00000001 равен 1 б.. от цены. Это огромная разница. В первом случае прыжок вперед крупного заказа стоит целое очко, поэтому приоритет времени имеет большее значение, а во втором случае он в 100 раз дешевле, поэтому приоритет цены имеет большее значение. Другими словами, если вам нужно заплатить полный 1%, чтобы получить приоритет заполнения, это может того не стоить, потому что вы платите относительно большую сумму, увеличивая вероятность заполнения на относительно небольшую сумму, и, вероятно, лучше просто подождать в очереди, но если вам нужно заплатить только 1 базис, чтобы получить приоритет заполнения, С таким же успехом вы можете сделать это, потому что вы уменьшаете свое преимущество на относительно небольшую величину, увеличивая при этом вероятность заполнения на относительно большую сумму. Меньшие тики отдают предпочтение ценовому приоритету, а более крупные тики — временному приоритету.

Это, естественно, приводит к следующему вопросу: каково значение вашей позиции в очереди?

Дельты книги заказов

Есть только два способа снижения количества ценового уровня в книге ордеров: либо сделка пересечена, либо лимитный ордер покоя был отменен. Если бы снижение было вызвано торговым пересечением, то все другие ценовые уровни лучше, чем этот, также пересекались бы и, таким образом, снижались. Мы можем выровнять тикерную ленту с тиковыми открытиями и отменами ордеров и пометить каждое снижение как сделку или отмену. Интуитивно, сделка означает, что две стороны согласились совершить сделку по определенной цене, в то время как отмена означает, что одна сторона решила, что она больше не желает покупать или продавать актив по определенной цене. Таким образом, на первый взгляд, мы можем сказать, что отмена по лучшей ставке является более сильным сигналом о том, что рынок будет двигаться вниз в краткосрочной перспективе, чем сделка, достигающая этой ставки.

С другой стороны, есть только один способ увеличения количества ценового уровня в книге заказов: размещается оставшийся лимитный ордер.

Как приращения, так и уменьшения в стакане раскрывают частную информацию участников рынка и, таким образом, дают краткосрочный ценовой сигнал.

Лучшие индексы цен и оптимальные биржевые сборы

В настоящее время большинство ценовых индексов берут торговые данные с нескольких бирж и агрегируют их вместе, чтобы получить средневзвешенную по объему цену. Индексы Tradeblock, в частности, также добавляют штрафы за обменные веса за бездействие и за отклонения цен от остальной части пакета. Но есть ли что-то еще, что мы можем сделать?

На GDAX с комиссией мейкера 0 базисных пунктов и комиссией тейкера 30 базисных пунктов печатная сделка по цене 4000 долларов США за BTC, попадающая в сторону предложения, фактически является продавцом, продающим по цене 4000 долларов США за BTC, и покупателем, покупающим по цене 4012 долларов США за BTC. «Справедливая цена» этой сделки должна быть ближе к $4006/BTC, а не к тому, что было напечатано на самом деле. С другой стороны, поскольку комиссии Bittrex в размере 25 базисных пунктов симметрично применяются как к производителям, так и к покупателям, справедливой ценой является печатная цена. Другими словами, печать 4000 долларов США / BTC — это фактически покупатель, покупающий по цене 4010 долларов США / BTC, и продавец, продающий по цене 3990 долларов США / BTC, что в среднем соответствует самой печати.

Таким образом, с точки зрения определения цен, тикерные ленты не сопоставимы напрямую между биржами, а вместо этого должны быть вычтены из комиссий и стандартизированы при построении индекса цен. Конечно, здесь есть некоторые сложности из-за уровней комиссий, основанных на объеме, которые могут увеличивать или уменьшать асимметрию комиссий мейкера и тейкера по мере их роста, поэтому мы не можем точно знать, где покупатели покупали и где продавцы продавали. Это также предполагает два интересных следствия.

Во-первых, обнаружение цен ограничено и в некотором роде шизофренично на биржах с сильной асимметрией комиссий мейкера и тейкера. Предполагая, что большинство счетов на GDAX находятся на уровне комиссии мейкера-тейкера 0/30 б.., и заметив, что GDAX часто имеет спреды в 1 пенни в своей книге BTCUSD, каждая сделка, напечатанная на заявке, примерно «справедливая стоимость» торгуется на 15 б.. ниже спота, а каждая сделка, печатаемая по предложению, примерно «справедливая стоимость», торгуется на 15 б.. выше спота. Таким образом, «справедливая цена» в спокойные времена быстро колеблется между этими двумя точками без дальнейшей детализации для определения цены между ними.

Во-вторых, как и в случае с налоговыми ставками между производителями и потребителями, между производителем и покупателем существует некоторая эквивалентность в отношении их комиссионного сбора. Если вы берете с производителей относительно больше, они расширяют книгу и перекладывают часть платы на берущих. Если вы берете с покупателей относительно больше, производители затягивают книгу и поглощают часть комиссионных сборов с покупателей. Особый крайний случай здесь заключается в том, что вы настолько отдаете предпочтение создателям, что книга сжимается до одного тика на спреде (как мы часто видим на GDAX), и книга не может стать более плотной. После этого момента любая дополнительная комиссия теперь ложится на саму биржу с точки зрения упущенной выгоды. За пределами этого особого случая мы видим, что на самом деле не имеет значения, с какой стороны взимается комиссия, а скорее важна сумма комиссии мейкера и тейкера. В конечном счете, как и кривая Лаффера в налоговой политике, биржи сталкиваются с проблемой оптимизации доходов в политике комиссионных. Мы видим, что крайние случаи такие же, как и с налоговой политикой. Если биржа не взимает комиссию, она не приносит дохода. Если бы биржи взимали 100% комиссию, сделок бы не было, и, следовательно, они также не получали бы дохода. При некотором дополнительном размышлении становится ясно, что биржевой доход по отношению к общему уровню комиссии является вогнутой функцией с уникальным максимумом.

Конфиденциальные данные

Каждый внебиржевой стол имеет полууникальные помеченные графические данные адресов каждого из своих контрагентов и потоков монет между ними и известными биржевыми адресами. Помеченные данные являются хорошей отправной точкой для многих видов алгоритмов машинного обучения.

У каждого майнера есть собственные данные о своих предельных затратах на чеканку монеты (в PoW). Если у них также есть представление о том, где они находятся по отношению к остальным шахтерам в мире с точки зрения эффективности, они могут получить уникальное представление о краткосрочном избытке и дефиците предложения.

Черные ящики

Все знают, что черные ящики — это плохо. Трудно, если не невозможно, сказать, что происходит, и когда что-то идет не так, очень трудно диагностировать, почему. Тем не менее, многие из лучших хедж-фондов и магазинов реквизита в конечном итоге создают черные ящики. Для этого есть несколько очень веских причин. Во-первых, люди приходят и уходят в фирмы, и плохо документированному устаревшему коду будет трудно понять новичкам. Во-вторых, конкуренция на рынке означает, что любая стратегия, которую может понять один ум во всей ее полноте, в конечном итоге проиграет стратегии, разработанной в сотрудничестве с экспертами и специалистами в своей узкой области. Наконец, слияние стратегий часто лучше, чем их запуск по отдельности. Например, предположим, что у вас есть долгосрочная стратегия импульса (S1), а также краткосрочная стратегия возврата к среднему значению (S2). Конечно, S1 может извлечь выгоду из краткосрочных преимуществ исполнения S2 и, конечно же, S2 может извлечь выгоду из долгосрочных предсказаний дрейфа S1. Поэтому, естественно, мы можем объединить их в объединенную стратегию, которая более эффективна, чем любая из ее составляющих. В конечном счете, стратегии становятся черными ящиками не потому, что черные ящики желательны, а несмотря на то, что черные ящики нежелательны.

Распутывание смешанных факторов

Предположим, у нас есть модель, которая предсказывает частоту поездок Uber, используя двоичный индикатор того, была ли земля влажной, и она работала очень хорошо. Очевидно, что то, что земля влажная напрямую, не имеет ничего общего с поездками Uber, но, косвенно, дождь заставляет землю быть влажной, а дождь также заставляет людей хотеть больше пользоваться Uber. Несмотря на то, что наша ложная модель работает хорошо, она подвержена риску хвоста. Если водопроводная труба лопнет в какой-то части города, что приведет к намоканию земли или произойдет естественное наводнение, мы ошибочно предскажем, что частота поездок Uber в этом районе увеличится.

В общем, когда A подразумевает B (A = >B), а A подразумевает C (A = >C), модель B = >C может работать, но только случайно. Поэтому крайне важно, чтобы прогностические отношения соответствовали интуиции и здравому смыслу. Недостаточно слепо добывать данные и находить сильные прогностические сигналы, но мы должны стремиться разгадать любые мешающие факторы из них до того, как сигналы соберутся в черный ящик, в котором эти факторы будет все труднее разгадать.

Возьмем другой пример, скажем, A = >B и B = >C. Модель A=>C будет работать, но уступает модели B=>C. Во-первых, A = >C оставляет немного денег на столе, потому что A может быть не единственной вещью, которая вызывает (в каузальном смысле Грейнджера) B; возможно, A’ также вызывает B. Во-вторых, если отношения A=>B разрушаются, модель A=>C также разрушается, но модель B=>C все еще работает.

Выбор функций

Переходя к многофакторным моделям, объекты в идеале должны быть максимально ортогональны друг другу. Например, предположим, что мы исследуем цену мороженого в зависимости от цены на сахар и цены на молоко. Возможно, лучшей моделью было бы использовать цену и сезон сахара (весна, лето, осень, зима). Особенности первой модели связаны инфляцией, относятся к категории «пищевые примитивы/ресурсы» и «расходные материалы» и относятся к категории «расходные материалы» и относятся к стороне предложения производства мороженого, в то время как последняя модель имеет 2 признака, которые гораздо более ортогональны (один со стороны предложения и один со стороны спроса). Очевидно, что использование 3 характеристик цены на сахар, цены на молоко и сезона сделало бы модель более точной, но по мере увеличения размерности модели калибровка будет занимать, по крайней мере, сверхлинейно дольше, если не экспоненциально дольше. К тому времени, когда у вас есть 20 объектов, становится невозможным запускать определенные методы оптимизации, такие как градиентный спуск, поэтому выбор функций является ключевым. Мы должны отказаться от коррелированных признаков в пользу более ортогональных признаков.

Эпистемология

И эмпиризм, и дедуктивные рассуждения ценны в контексте проектирования количественных моделей.

Одним из недостатков чисто эмпирического подхода является то, что мы не можем проводить контролируемые эксперименты на рынках. Мы не можем зафиксировать момент времени и попробовать два разных действия, чтобы увидеть, какое из них работает лучше. Другими словами, в мягких / социальных науках нет истинных контрфактов, в отличие от точных наук. В торговле, в частности, мы также не можем точно измерить влияние наших собственных действий на рынок. Другими словами, в течение исторического времени, когда мы не торговали активно, мы не можем знать, как бы вела себя книга заказов и поток, если бы мы активно торговали, и в течение исторического времени, когда мы активно торговали, мы не можем знать, как вели бы себя книга заказов и поток, если бы мы не были на рынке. Еще один недостаток эмпиризма заключается в том, что для любой данной исторической модели существует бесконечное количество моделей, которые соответствовали бы этой модели, но каждая из них могла бы сделать совершенно другое предсказание будущего (т.е. версию проблемы черного лебедя). У Юма, Витгенштейна, Крипке, Куайна, Поппера и Талеба есть много критических замечаний и защит логического эмпиризма и проблемы индукции, которая развивает эти идеи.

Одна из проблем с чисто дедуктивными рассуждениями заключается в том, что мы, люди, склонны к ошибкам. Любая логическая ошибка в цепочке дедукции немедленно аннулирует результат. Более того, обоснованность вывода требует не только того, чтобы каждый логический шаг на этом пути был правильным, но и того, чтобы предпосылки, которые мы предполагаем, были истинны сами по себе и соответствовали реальности. Поскольку модели должны быть удобными, чтобы быть полезными, они часто являются упрощением мира и делают предположения, которые не противоречат реальности.

Рассмотрим на примере. Предположим, вы хотите запустить симуляцию Монте-Карло для траектории цены актива. Если вы берете исторические данные о доходности активов и берете из них образцы непосредственно для своих путей моделирования, вы столкнетесь с проблемой: 1) данные разрежены в хвостах, которые представляют экстремальные события, и 2) у вас есть некоторая шумность в данных вдали от некоторого неизвестного истинного распределения вероятностей возврата. Теперь, скажем, вместо этого вы подгоняете исторические данные под нормальное распределение, а затем выбираете из них образцы для своих путей моделирования. Теперь вы сталкиваетесь с проблемой, когда доходность на самом деле не распределяется нормально в реальности (т.е. это лептокуртика; жирные хвосты). Таким образом, вместо всего этого вы теперь подгоняете исторические доходности к распределению Коши или распределению Леви или, в более общем плане, к альфа-стабильному распределению Леви. Теперь, на этом этапе, модель становится все более сложной, и вы случайно пишете ошибку в коде. После нескольких дней тяжелого труда вы выясняете проблему и устраняете ее. Код запускается в производство, и у вас есть работающая модель… около 2 лет. Спустя 2 года выясняется, что 5-е моменты имеют значение и ваше альфа-стабильное распределение Леви не улавливает эту особенность реальности. Вот так в основном и проходит игра.

Наконец, вот две эвристики, которые я обычно использую: 1) Если вы сомневаетесь, по умолчанию руководствуйтесь здравым смыслом. 2) При прочих равных условиях простота и скупость лучше, чем сложность и раздувание.

Трения в реальном мире

Иметь теоретически выгодный алгоритм — это одно, а иметь дело с трениями реальности — совсем другое.

Предположим, вы отправляете запрос на биржу для размещения заказа, и обычно вы получаете обратный звонок, подтверждающий, что заказ был размещен или что произошла ошибка, и заказ не был размещен. Скажем, однажды вы не получите обратный звонок по вашему запросу на публикацию. Считаете ли вы этот приказ Шредингера опубликованным или невыполненным? Вы подвержены ошибкам типа 1 (ложноположительное) и типа 2 (ложноотрицательное) из-за неправильной классификации заказа. Является ли один тип ошибки менее дорогостоящим, чем другой?

Предположим, вы используете арбитражную стратегию между двумя разными биржами. Что делать, если API одной биржи выходит из строя в середине совершения пары сделок на обеих биржах. Один мог пройти, но другой, возможно, потерпел неудачу. Теперь у вас есть нежелательный доступ к инвентарю. Как лучше всего с этим справиться?

Как вы справляетесь с задержками публикации и отмены, когда биржа подвергается DDoS-атакам или механизм сопоставления загружен под нагрузкой?

А как насчет того, когда биржи вносят недокументированные, необъявленные изменения в свои API?

Предположим, что биржа обновляет баланс для балансов своих клиентов параллельно с их механизмом сопоставления, выполняющим сделки, поэтому балансы, запрашиваемые в ту же миллисекунду или микросекунду, что и печать сделки, могут сообщать клиенту о конфликтующих состояниях баланса, когда это выглядит как выполненная сделка, но балансы еще не изменились. Как вы можете спроектировать свои собственные системы для синхронизации с согласованным состоянием мира, даже если биржа сообщает вам о конфликтующих состояниях?

Предположим, что комиссии на бирже слишком высоки, чтобы вы могли размещать лимитные ордера по оптимальной цене, полученной из модели. Или, что еще хуже, некоторые из ваших конкурентов были вовлечены в сделки с обменом на комиссионные. Как это изменит ваше поведение?

Как вы справляетесь с ребалансировкой фиатных денег, если ваш банк не работает в выходные дни, но торговля криптовалютой ведется 24/7?

Можно утверждать, что актив на одной бирже не является полностью взаимозаменяемым с тем же активом на другой бирже. Во-первых, риск контрагента каждой биржи различен, а это означает, что активы эффективно истекают кровью из-за различных отрицательных процентных ставок. Во-вторых, поскольку большинство бирж имеют лимиты на ввод/вывод средств, превышение лимитов означает, что вы больше не можете физически перебалансировать активы между биржами в течение некоторого периода времени.

Как вы справляетесь с форками, аирдропами, пылевыми атаками и другими ситуациями, от которых вы не можете отказаться?

Вот несколько эвристик, которым мы обычно следуем. 1) Все, что может пойти не так, пойдет не так, даже то, о чем вы в настоящее время не можете подумать, поэтому создавайте вещи, чтобы потерпеть неудачу изящно. 2) Вы и все третьи лица, с которыми вы связаны, например, биржи, будете совершать ошибки. 3) В отличие от потребительских технологий, не ломайте вещи и быстро повторяйте; Скорее, если вы потеряете слишком много денег, у вас не будет второго шанса. 4) Создавайте резервные копии системы и данных везде, где это возможно, и создавайте избыточность в своих операционных процессах, чтобы учесть человеческие ошибки. 5) Не используйте типы с плавающей запятой, так как потеря точности может быть очень суровой для символов с очень маленькими ценами (например, KINBTC). 6) Зарезервируйте достаточное количество вызовов API из лимита скорости API, чтобы отменить все открытые ордера в любое время.

Заключительные мысли

Трейдинг — одна из немногих профессий в мире, где прямая цель состоит в том, чтобы превратить капитал в еще больший капитал. Соедините это с природой криптовалюты Дикого Запада, и вы получите выгребную яму типов быстрого обогащения. Все хотят простых ответов, но никто не хочет учиться ремеслу. Люди хотят, чтобы говорящие головы по телевизору рассказывали им о целевых ценах, когда покупать, а когда продавать. Они хотят купить этот курс онлайн-трейдинга за 99.99 долларов США или эту алгоритмическую стратегию на основе ТА за 19.99 долларов в месяц. Но на самом деле никто не продаст вам волшебную шкатулку, которая печатает деньги; они оставят ее себе. Волшебных формул для генерации PnL не существует. Рынки постоянно развиваются, и со временем игра становится только сложнее. Единственный способ оставаться впереди игры — это нанимать лучших талантов, которые могут адаптироваться и постоянно превосходить самих себя.

Рынок представляет собой гигантский покерный стол с миллионами игроков, каждый из которых считает, что может переиграть своего соседа. И уже есть немного самоотбора для людей, которые сидят за этим столом. Победа означает игру лучше, чем чуть более половины капитала за столом, что, в свою очередь, означает, что вы должны быть лучше, чем 90% игроков, поскольку капитал начисляется победителям по степенному закону.

В культурном отношении торговая игра отличается от венчурного инвестирования. В Кремниевой долине стоит быть тем, кого Питер Тиль называет определенным оптимистом. Вы должны верить, что новые технологии изменят мир, и что вы можете и наметите курс, чтобы это произошло. В Чикаго, где есть магазины реквизита, культура сильно отличается. Там стоит быть очень состязательным мыслителем. Все хотят выиграть так же сильно, как и вы, и каждый раз, когда вы совершаете сделку, в глубине души у вас возникает мучительная мысль о том, что, возможно, человек на другой стороне знает что-то, чего вы не знаете. Стартап в Долине должен сначала бороться с безразличием мира, прежде чем он столкнется с реальной конкуренцией на рынке. С другой стороны, торговый магазин, не имея клиентов, с которыми нужно иметь дело, не может избежать конкуренции даже с самого начала. Самые лучшие магазины окутывают себя тайной. Криптовалютная торговля — это пересечение этих двух миров, и в этом зарождающемся пространстве нет явных победителей. Мы, в Galois Capital, стремимся к этой цели.

Источник