您當前的位置:首頁 > 攝影

聰明錢因子模型的2.0版本

作者:由 Fitz Hoo 發表于 攝影時間:2020-06-06

更多開源金工團隊的原創研究,歡迎關注微信公眾號:建榕量化研究

報告作者:魏建榕、傅開波、高鵬

一、引言

我們於2016年7月提出的聰明錢因子模型,在量化投資同行中獲得了較高的評價。聰明錢因子模型的核心邏輯是,從分鐘行情資料的價量資訊中,嘗試識別機構參與交易的多寡,最終構造出一個跟蹤聰明錢的選股因子。聰明錢因子模型在首次釋出時,受到了較多的關注,究其原因主要有兩個方面:其一,模型邏輯簡潔,樣本內表現良好;其二,模型首次提出了“高頻資料,低頻因子”的研究模式,是高頻因子領域的引領之作。聰明錢因子從提出迄今已有3年7個月,我們一直密切跟蹤其動態表現。本篇報告的主旨是,提出關於聰明錢因子模型的重要改進。

二、聰明錢因子的原始模型

聰明錢因子模型的核心問題是,如何識別聰明錢的交易。大量的實證研究表明,聰明錢在交易過程中往往呈現“單筆訂單數量更大、訂單報價更為激進”的基本特徵。基於這個考慮,我們構造了用於度量交易聰明度的指標S(表1,步驟2),指標S的數值越大,則認為該分鐘的交易中有越多聰明錢參與。藉助指標S,我們透過以下方法篩選聰明錢的交易:對於特定股票、特定時段的所有分鐘行情資料,將其按照指標S從大到小進行排序,將成交量累積佔比前20%視為聰明錢的交易(表1,步驟3)。

聰明錢因子模型的2.0版本

為了更形象地展示這個劃分過程,圖1中我們給出了一個簡單示例。圖1的上半部分:這是一段長度為半小時的分鐘行情資料,按照時間順序排列,時間標籤依次標為1-30,藍柱代表每分鐘的成交量,紅點代表每分鐘的S指標值。圖1的下半部分:我們按照S值從大到小對原始行情資料進行了重新排序,柱子仍代表每分鐘的成交量,綠線代表成交量從左到右的累計佔比(相對於總成交量);以成交量累計佔比20% 作為劃分的界線,將最左側的6個分鐘資料(紅柱)劃歸為聰明錢的交易,剩餘的其他分鐘資料(藍柱)則被劃為普通資金的交易。

聰明錢因子模型的2.0版本

從“量-價”相空間的視角,我們可以更直觀地感受S指標在劃分過程中起到的作用。在圖2中,橫座標為分鐘成交量

V

,縱座標為分鐘漲跌幅的絕對值

|R|

,每個散點代表一個分鐘交易。在最終的劃分結果中,紅色散點為聰明錢交易,藍色散點為普通交易,虛線為劃分兩種交易的分界線。不難發現,分界線的形狀直接取決於S指標的構造方式——假設成交量累積佔比恰好為20%的分鐘交易的S指標值為

S_{0}

,則分界線表示式為

|R|=S_{0}\sqrt{V}

。不同的S指標的構造方式,將產生不同的聰明錢劃分結果。

聰明錢因子模型的2.0版本

綜上討論,聰明度指標S是聰明錢因子模型的核心部件。數學模型不可能盡善盡美,在聰明錢的劃分過程中,不可避免存在錯誤劃分的情況:將普通交易劃分為聰明錢交易,或者將聰明錢交易劃分為普通交易。隨著而來的問題即是,能否透過對S指標的改進,最佳化對聰明錢的劃分,進而提升聰明錢因子的選股能力?這是我們在第3節中將要重點討論的內容。

三、聰明錢因子的改進方案

聰明錢因子模型自2016年7月釋出以來,已進行了3年多的樣本外跟蹤。圖3給出了聰明錢因子的收益表現,在2016年7月-2017年初的時段表現穩健,在2017年初之後選股能力明顯減弱。在本節中,我們將重新考察聰明度S指標的構造方式,尋找聰明錢因子的改進方案。

聰明錢因子模型的2.0版本

01 對開根號的修正

在聰明錢因子的構造步驟中, S指標的計算公式為

S = |R|/\sqrt{V}

,分母為分鐘成交量

V

的開根號。我們選擇開根號的初衷是:(1)開根號有簡單清晰的數學影象可對應;(2)大量的實證研究表明,價格變化與成交量的平方根之間存在正比關係。

為了方便討論,我們不妨嘗試一般化,將分鐘成交量V的指數項定義為可變的引數,這樣S指標公式可以寫成如下形式:

S = |R| / (V^\beta)

其中,

R

為分鐘漲跌幅,

V

為分鐘成交量,

\beta

為分鐘成交量

V

的指數項引數。不難看出,當

\beta

取值為0。5時即為原始聰明錢因子 S指標;當

\beta

取值為0時,S指標可以寫為

S = |R|

;當

\beta

取值為-0。5時,S指標可以寫為

S=|R|*\sqrt{V}

的乘積形式。

我們選取若干不同

\beta

值分別構造S指標,計算對應聰明錢因子,並對因子進行績效回測。因子歷史回測的基本框架為:回測時段為2013年4月30日至2019年12月31日;樣本空間為全體A股,剔除ST股和上市未滿60日的新股;每月月初調倉,持倉一個自然月,交易費率千分之三。

從不同

\beta

值的IC均值上看,當

\beta

為0。7時,因子IC均值在0左右,因子幾乎無效;隨著

\beta

值的逐漸減小,因子IC均值的絕對值逐漸增大,最後達到一個飽和的平臺。可以看出,原始聰明錢因子(

\beta

=0。5)的選股能力,遠遠沒有達到最優的狀態。

聰明錢因子模型的2.0版本

為了進一步評價因子的選股能力,我們回測了不同

\beta

值下的聰明錢因子多空對沖資訊比率和多空對沖淨值曲線。可以看出,當

\beta

由0。7逐漸減小時,資訊比率逐漸增加,當

\beta

取值為0。1左右時資訊比率最大(3。67),當

\beta

由0。1繼續逐漸減小時,資訊比率呈現出緩慢下降的趨勢,但整體資訊比率均高於2。5。可以看出,

\beta

取值小於0。5以下的因子選股能力要明顯優於原始聰明錢因子(

\beta

=0。5),並且當

\beta

取值為0。1左右時,因子的選股能力最強。

需要說明的是:(1)為了排除路徑依賴對因子回測結果的影響,我們在月度調倉頻率下,分別選取月初、月中、月內1/4時點、月內3/4時點作為調倉時點,綜合比較4條不同路徑的回測結果後,上述結論依然穩健。(2)為了排除聰明錢因子在其他因子上的暴露對於回測結果的影響,我們將剔除了主要風格因子後的聰明錢因子進行回測,回測結論依舊穩健。

聰明錢因子模型的2.0版本

聰明錢因子模型的2.0版本

02 S指標的重新構造

基於不同的邏輯,S指標的構造方式也會不同。本小節我們嘗試了3種不同的S指標構造方式 ,並對因子的選股能力進行回測。表2給出了這3種S指標的公式和含義。

具體來看:S1指標單獨考慮成交量因素,將分鐘成交量較大的交易劃分為聰明錢交易;S2指標綜合考慮分鐘交易的成交量和漲跌幅絕對值排名,將排名之和靠前的交易劃分為聰明錢交易;S3指標是基於原始S指標的變形,我們嘗試對分鐘成交量作對數變換構造聰明錢因子。

聰明錢因子模型的2.0版本

我們分別對上述3個S指標構造的聰明錢因子的選股能力進行了回測,並與原始聰明錢因子進行了比較。3個S指標構造的聰明錢因子的IC均值分別為-0。036、-0。043、-0。050,多空對沖資訊比率分別為2。03、2。61、3。74,整體上新因子選股能力均優於原始聰明錢因子(資訊比率1。69),對分鐘成交量作對數變換構造的聰明錢因子(S3指標)選股能力最強。

聰明錢因子模型的2.0版本

聰明錢因子模型的2.0版本

四、若干重要討論

01 不同截止值的差異

在原始聰明錢因子的構造過程中,我們取成交量累積佔比前20%的分鐘視為聰明錢交易,選取20%作為截止值的原因是考慮到:在我國股票市場中,機構投資者交易佔比較低。從不同年份的機構投資者交易佔比資料可以看出,機構投資者對全市場成交量的貢獻比例在10%-20%之間,年度均值在13%左右。

聰明錢因子模型的2.0版本

我們基於

\beta

值為0。25的S指標,分別選取10%、15%、20%、30%、40%、50%作為截止值構造聰明錢因子,並測試不同截止值下因子的選股效果。可以看出,隨著截止值的提高,多空對沖資訊比率取值逐漸降低,多空對沖收益曲線不斷下降。當截止值取值為15%時,資訊比率取得最大值(3。35),略高於原始因子20%截止值的資訊比率(3。27),整體上選股能力差異不大。聰明錢因子模型選取20%作為截止值是具有合理支撐的。

聰明錢因子模型的2.0版本

聰明錢因子模型的2.0版本

02 不同樣本池的差異

改進後的聰明錢因子在不同樣本空間均具有較強的選股能力,我們選取

\beta

值為0。1(

S=|R|/(V^{0.1})

)與對數成交量(

S=|R|/ln(V)

)兩個S指標的聰明錢因子,給出了因子在不同樣本空間的多空對沖淨值表現。

對於

\beta

值為0。1下的因子:滬深300成分股中,因子多空對沖年化收益14。5%,資訊比率1。65,月度勝率74。7%;中證500成分股中,因子多空對沖年化收益17。2%,資訊比率2。11,月度勝率74。7%;中證1000成分股中,因子多空對沖年化收益26。3%,資訊比率3。81,月度勝率82。3%。

聰明錢因子模型的2.0版本

對於對數成交量下的因子:滬深300成分股中,因子多空對沖年化收益16。1%,資訊比率1。75,月度勝率73。4%;中證500成分股中,因子多空對沖年化收益18。0%,資訊比率2。18,月度勝率74。7%;中證1000成分股中,因子多空對沖年化收益26。5%,資訊比率3。65,月度勝率86。1%。

聰明錢因子模型的2.0版本

五、風險提示

模型測試基於歷史資料,市場未來可能發生變化。

標簽: 因子  聰明  指標  選股  多空