您當前的位置:首頁 > 書法

讀《量化交易:演算法、分析、資料、模型和最佳化》第五章

作者:由 張偉 發表于 書法時間:2020-11-05

第五章標題是“限價指令簿:資料分析和動態模型”,從標題就可以看出本章重點就是研究訂單簿。在此,先介紹限價指令和市價指令的概念。限價指令是以指定一個價格買入或賣出一定數量的股票;市價指令是按市場價格買入或賣出一定數量的股票。主要區別限價指令成交機率可能較低,但限價指令的成交價格等於或優於你申報的價格,而市價指令的成交價格一般與當時的市價有關,其成交機率較高,但成交價格可能較差。A股的市價指令是按對手方從最優一檔到五檔依次成交(即對手方一檔成交完 ,再按對手方二檔成交),若市場指令量超過五檔量,則超過部分可以轉撤銷,也可以轉限價。下面介紹限價指令簿(LOB),LOB用於記錄市場上買賣雙方多層資訊(價格、數量等)的交易機制。本章第一部分是對LOB資訊的解析,第二部分是介紹對於LOB資料進行最大似然擬合的Hawkes過程,第三部分是介紹了與LOB資料分析有關的機器學習方法(該書介紹較少,後面不做重點討論),第四部分是討論了LOB的排隊模型。

讀《量化交易:演算法、分析、資料、模型和最佳化》第五章

一、LOB資訊解析

LOB包括幾個關鍵部分:市場訂單或限價訂單的出現、執行、取消、價格變化以及短期價格平衡。當價格發生變化時,訂單簿買賣側的訂單序列形狀也會發生變化。訂單簿對於潛在的市場供需不平衡給出了訊號,也可以傳遞投資者對於價格變化的反應資訊。具體而言,包括:

1、交易量不平衡

根據訂單價格與交易價格的距離,給出不同價格下交易完成的機率,並結合不同價格買賣訂單量來測度交易的不平衡。例如,價格水平x,在短時間內執行的機率

f(x)=cx^{-\alpha}

,透過累加各價格水平可用於衡量買賣不平衡度。

2、機率權重交易量

定義在t時刻提交訂單,在價格水平L下能夠在提交後

\tau

秒內執行的機率

\pi_{l,i,\tau}

定義在t時刻,價格水平L,買入\賣出側的交易序列長度為

v_{t,l;i}

機率權重交易量為

\bar{v}(t,\tau, L; i) :=\frac{1}{\sum_{i,l}v_{t,l;\tau}}\sum_{l=0}^{L}v_{t,l;i} \pi_{l,i,\tau}

3、逆交易量權重公平價值價格

定義

p^B_{0}

v^B_{0}

為某一個價格水平下的買入價和交易量,類似定義賣出價和賣出量,則逆交易權重公平價值價格為

\hat{P^{(IWFV)}} = \frac{p^B_0v^A_0+p^A_0v^B_0}{v^B_0+v^A_0}

4、閾值流動性公平價值價格

給定閾值

\theta

,時刻t買入和賣出側消費水平

L^B_{t}

L_t^A

L_t^B = inf\{L:\sum_{l=0}^{L}v^B_{l,t}\geq \theta\}

,同理可得

L_t^A

閾值流動性公平價值價格

\hat{P_t}=\frac{1}{2\theta}[\theta p^B_{L_t^{B,t}}+\sum_{l=0}^{L_t^B-1}v^B_{l,t}(p^B_{l,t} - p^B_{L_T^{B,t}}) + \sum_{l=0}^{L_t^A-1}v^A_{l,t}(p^A_{l,t} - p^A_{L_t^{A,t}})]

二、多元Hawkes過程

泊松過程

N(t)

的到達時間是隨機點,即泊松點過程,若當其強度

\lambda(t)

也是隨機過程時,點過程稱為雙隨機過程。

一元情況下,強度過程為

\lambda(t) = \phi(\mu(t) + \int_{u<t}h(t-u)dN(\mu)

當取

\phi(x) = x

\mu(t) = \mu

,當核函式

h(x)=\alpha e^{-\beta x}

時,

\lambda_{\theta}(t) = \mu + \int_{u<t}\alpha e^{-\beta(t-\mu)}dN(\mu) = \mu + \sum_{i:t_i<t} h_{\theta}(t-t_i)

多元情況下,假定核函式為指數核函式,則雙隨機點過程的強度為

\lambda_t^{(k)} = \mu^{(k)} + \sum_{j=1}^{K} \alpha_{jk} \int_{u<t} e^{-\beta_{jk}(t-u)}dN_u^{(j)} k=1,...,K

上式也稱為包含指數核的K變數Hawkes過程。

在瞭解多元Hawkes過程後,我們可以將訂單到達訂單簿買方或賣方側看作自激勵事件,強度包含了市場訂單的平均到達速度資訊,當訂單簿中買方側的限價訂單多於賣方側的限價訂單時,價格上升的機率增大,反之機率減小。考慮二元Hawkes過程,強度過程可以表達為

\lambda_t^{1} = \mu^1 \hat{v}_{2t} + \frac{1}{\bar{w_1}} \sum_{t_i<t}\alpha_{11}w_{1i}e^{-\beta_{11}(t-t_i)}+\frac{1}{\bar{w_2}} \sum_{t_j<t}\alpha_{12}w_{2j}e^{-\beta_{12}(t-t_j)}we

\lambda_t^{2} = \mu^2\hat{v}_{1t} + \frac{1}{\bar{w_2}} \sum_{t_i<t}\alpha_{22}w_{2i}e^{-\beta_{22}(t-t_j)}+\frac{1}{\bar{w_1}} \sum_{t_i<t}\alpha_{21}w_{1i}e^{-\beta_{21}(t-t_i)}

其中,

\bar{w}_1

\bar{w_2}

為交易量

w_{1i}

w_{2i}

[0,t)

時間內平均值,

\bar{v_{1t}}

\bar{v_{2t}}

分別為買入訂單和賣出訂單的機率權重交易量。強度過程的對數似然函式可以表示為

\mathscr{L}(\mu^1,\alpha_{11},\alpha_{12},\beta_{11},\beta_{12}) + \mathscr{L}(\mu^2,\alpha_{21},\alpha_{22},\beta_{21},\beta_{22})

採用Daley和VereJones(2003),使用MLE進行估計,實踐中使用R包可以估計。

三、LOB動態排隊論建模

書中認為訂單簿可以看成一個排隊系統,因此可以將LOB與優先排隊模型之間建立聯絡。

Cont和de Larrard(2013)模型

該模型的狀態變數包括 :買入價(

s_t^b

)、買方序列長度(

q_t^b

) 、賣出價(

s_t^a

)、賣方序列長度(

q_t^b

)。

假設:

a.

買入賣出價差為常數

\delta

,買入和賣出價是

\delta

的倍數;

b

。當最優買入序列耗盡,最優買入價和最優賣出價都下降一個單位;

c

。當最優賣出序列耗盡,最優買入價和最優賣出價都上升一個單位;

d

。當最優買入或賣出序列耗盡時,抽樣生成一個新的最優買入或賣出序列長度,抽樣過程基於密度函式,該函式與當前最優買賣序列長度有關;

e

。限價、市場和取消訂單的單位都是1,產生過程都服從引數為

\lambda

\mu

\theta

的獨立泊松分佈。

定義離散空間上的馬爾科夫鏈

(s_t^b,q_t^b,q_t^a)

,定義序列減短時間

\tau_i = \tau^a_i \wedge\tau^b_i

\tau_i^a=inf\{t>\tau_{i-1}:q^a_t =0\} - \tau_{i-1}

,同理可以的

\tau_i^b

,在假定對稱的情況下,則

P(\tau_a > \tau_b|q_0^b = x,q_0^a=x) = P(\tau_b > \tau_a|q_0^b = x,q_0^a=x)  = \frac{1}{2}

由此可知,

P(\tau > t|q_0^b = x, q_0^a=x) = P(\tau_a > t|q_0^b = x,q_0^a=x) =P(\tau_b > \tau_b|q_0^b = x,q_0^a=x)

給定

(q_0^a,q_0^b)

\tau

的條件分佈為

P(\tau>t|q_0^b = x, q_0^a =y)=\sqrt{(\frac{\mu+\theta}{\lambda})^{x+y}} \xi_{x,\lambda,\theta+\mu}(t)  \xi_{y,\lambda,\theta+\mu}(t)

其中

\xi_{\nu,\lambda,\theta+\mu}(t)=\int_{t}^{\infty}\frac{\nu}{u}I_{\nu}(2\sqrt{\lambda (\theta + \mu)u})exp[-u(\lambda+\theta+\mu)]du

I_{\nu}

為第一類改進貝塞爾方程

I_{\nu} = \sum_{m=0}^{\infty}\frac{1}{m!\Gamma(\nu+m+1)}(\frac{x}{2})^{2m+\nu}

f

。對於所有

(x,y)\in \mathbb{N}^2

f(x,y)=f(y,x)

g

\sum^{\infty}_{x=1}\sum^{\infty}_{y=1}xyf(x,y)<\infty

定義g中無限序列

D(f)

可以證明當

n\rightarrow\infty

時,

P(X_i = \delta)=P(X_i = -\delta)= \frac{1}{2}

\frac{(\tau_1+\tau_2+\cdot\cdot\cdot+\tau_n)}{nlogn}\rightarrow^P \frac{D(f)}{\pi\lambda}

書中還提到了Huang(2015)在Cont和de Larrard(2013)基礎上提出了更一般的資料驅動模型,其定義了連續時間馬爾科夫鏈。

本章主要介紹了基於LOB的模型構建,包括:買賣訂單平衡問題,訂單強度(Hawkes過程)和排隊論,其中Hawkes和排隊論我個人也不熟悉,也是查了些資料,有點一知半解,需要再讀讀相關文獻才可能真正領會。

標簽: 訂單  Lob  限價  指令  序列