您當前的位置:首頁 > 書法

關於量化交易的一些感悟

作者:由 人稱仲哥 發表于 書法時間:2021-04-30

本來沒有打算寫這篇文章,在寫股票短期動量因子回測一文時,想寫點量化經驗和感悟作為結尾,沒想到文思如尿崩,於是乾脆另開爐灶。

我接觸量化不算早,大概從2017年開始,那時候量化交易的關注度已經上來了。

2015年之前的量化交易者應該是用

文華財經

、交易開拓者等商業軟體,這些軟體自帶資料,內嵌的語言也不難,有點類似於Excel公式或者VBA,這些軟體至今仍有不少程式化交易者在使用。

基於技術分析的趨勢跟蹤系統在西方發展了幾十年,已有大量理論和實證。這種策略大多是機械交易系統,很容易程式化。

早期的量化交易主要做期貨,因為期貨的交易介面外接容易,不像股票存在一些不可描述的障礙,此外大A股T+1交易、停牌等影響流動性的機制也導致了這種擇時策略在股票市場上無法廣泛應用。

後來,python這門語言在資料分析和人工智慧上開始熱起來,基於python的量化模組也如雨後春筍,量化交易在業餘投資者裡的熱度逐漸提升。

關於量化交易的一些感悟

python:要你命3000(來源谷歌搜尋,侵權刪)

當時線上回測系統Quantopian的國內版各種寬也開始遍地開花,吸引了不少業務愛好者。我最早也是從這些線上回測平臺開始入門的,後面發現這些平臺在批量回測,引數最佳化上有諸多不便,並且回測速度慢,再加上不滿足只做API Caller(俗稱API呼叫俠),於是開始自學python,不久接觸到了vnpy,後來這個框架就成為了主要的研究和交易工具。

專業賽道上,隨著國內量化的興起,不少高學歷本土派以及有國外從業經驗的海龜們開始轉戰國內市場,量化私募開始逐漸興起。

關於金融市場和量化

要談量化,其實還是要講一下金融市場。

很早以前,經濟學家丟擲了隨機漫步和有效市場假說,他們認為市場參與者都是理性的,價格已經反應了各種情況,市場價格就是一個隨機遊走的過程,和投硬幣差不多,沒有什麼規律和訊號,所以投資者只要吃飯睡覺玩遊戲就好了,別浪費時間了。

當然,資產管理行業一直存在並且持續帶來超額收益這個實踐證明了有效市場假說是不完全對的。目前多數人認同強有效市場是不可能的,行為金融學和群體心理學認為市場參與者是不理性的。

市場有效性和市場的發達程度正相關,市場越發達就越有效,想獲取超額收益就越困難。但是市場不可能完全有效,即使是美國這樣高度發達的市場,也存在超額收益,只是確實不易,所以美國很多量化機構憑藉著低廉的資金瘋狂加槓桿,用槓桿的方式提升絕對超額收益。

目前中國市場的有效性還是低於美國,明汯老闆說中國的投資人是幸福的,從有效市場這個理論來說不無道理,中國公募基金的歷史業績也證明了這點。

現在還有一種理論認為市場是分形和混沌的。混沌理論裡面有個著名的蝴蝶效應,我以前很疑惑,為什麼蝴蝶會引發龍捲風。後來特意去看了混沌理論後才知道這是一種誤解。請看維基百科的解釋:

蝴蝶效應(英語:Butterfly effect)是指在一個動態系統中,初始條件的微小變化,將能帶動整個系統長期且巨大的鏈式反應,是一種混沌的現象。

這句話的重點是

初始值的輕微改變造成的長期鏈式影響是非常巨大的

,也就是不論是蝴蝶扇動翅膀,還是螞蟻伸了伸腿,這些都會造成初始值發生輕微改變,從而使長期的天氣系統發生翻天覆地的改變。並不是說因為蝴蝶扇動了翅膀才引起了龍捲風。

關於量化交易的一些感悟

一個雙杆擺動畫呈現混沌行為。 從開始略微不同的初始條件擺杆將導致一個完全不同的軌跡。雙杆擺是具有混沌方案最簡單的動力系統之一。(來源:維基百科)

以天氣預報這種一級混沌系統舉例,越短期的天氣預報越準確,越長期越不準確。就是因為初始值輕微變化,短期的影響比較小,但是長期鏈式影響越來越大。換句話說,長期準確的天氣預報是不可能的。

天氣預報只是一級混沌系統,一級混沌是指參與者的行為對系統執行沒有影響,比如天氣預報員的預報行為對天氣不會有影響。而投資交易市場是屬於二級混沌系統,

即參與者對系統的執行會產生影響。

二級混沌系統更加複雜,因為混沌理論認為,初始值的輕微改變在長期會帶來巨大的影響,所以假設作為散戶的你只買賣了100股股票,如果有平行宇宙的話,時間拉長了看,有這個買賣行為的宇宙市場的走勢和沒有這個行為的走勢會天差地別。

類比天氣預報,混沌理論認為金融市場的長期預測更不可能。短期預測有相對可能,這可以解釋為什麼高頻交易,T+0交易可以實現超高穩定盈利,而中低頻的交易則很難保證盈利的穩定性。

既然只有短期預測相對可行,那能否只做短期交易呢?

短期交易有三個特點:

交易成本大,收益不高(價格運動在短期內幅度有限),流動性不足

期限越短,這三個特點越明顯。因為投資是二級混沌,每個投資者的短期交易行為對初始值會造成巨大改變,而不僅僅是輕微改變。所以綜合下來,金融市場的短期預測也很困難。

因此,混沌理論也可以解釋,為什麼T+0或高頻交易的收益和市場活躍度呈現明顯正相關的關係。因為當市場參與者眾多的時候,高頻交易者的交易行為對整個混沌系統初始值的改變相對而言比較輕微,因此高頻交易者預測訊號的有效性就得到提升。

總結幾個觀點:

金融市場是高度隨機、高度複雜的。市場的預測幾乎是一件不可能的事情

。市場的有效程度和自身的發達程度有關,大部分金融市場起碼都是弱有效市場,賺取超額收益理論上是可行的,但實踐並不容易。

關於量化研究交易能解決的問題

量化相對主觀而言,能解決的問題主要有兩點:

海量資訊的加工和處理能力、交易執行的紀律性

相比主觀而言,量化在交易之前一般要先進行數量化分析,不管什麼樣的策略,對歷史資料的分析都必不可少。為了讓分析結果具備統計意義,資料量不能太少。完成後很多人還會做樣本外檢驗。一整套工作下來,處理的資訊可能是海量的,人腦無法完成這種任務。

但是根據上一節對金融市場的理解,

掌握了海量資訊的量化研究並不一定比掌握資訊較少的主觀研究更具有優勢。

海量資訊一是容易失去重點,二是如果不注意避坑的話,極有可能陷入過度擬合。這會讓研究者在錯誤的研究基礎上產生了虛幻的安全感,這比資訊較少還致命。

另外,主觀交易者在決策過程中可能參考了其它維度的資訊,雖然量化在量價方面的資訊量很大,但是裡面有不少是重複資訊。考慮資訊維度的話,整體資訊量的優勢不見得比主觀大。

總而言之,如果你認為量化可以讓你掌握更多的資訊,並且認為掌握更多的資訊能讓你具備更大的優勢,那麼量化研究交易可以解決你的問題。

至於交易執行的紀律性問題,量化其實只解決了一半,因為即使是全自動的

程式化交易

,你仍然可以隨時啟動或停止策略,或是臨時調整策略引數。不過相比主觀交易而言,對於一些反人性的交易,程式化確實可以有效執行。

下面再說幾個誤區:

只要具備數理背景、IT能力就完全可以做好量化。這些是做好量化的充分非必要條件,運氣也很重要。此外,假如有這方面優勢,也可以考慮學術研究、基礎研究、網際網路公司等,你們選擇可以很多。

量化交易門檻高,有優勢。量化相對主觀的門檻確實更高,但是在投資交易的過程中,大家仍然在同一個賽道上,門檻並沒有把其它競爭者從市場排除掉。而且

技術門檻在高度複雜的市場中未必有什麼優勢。

從事量化有職業光環。這種幻想更要儘早拋棄。不論自營還是資產管理,唯一的光環就是要能賺錢,其它全部是虛幻的。

關於CTA策略

說到量化策略,CTA策略是避不開的,這也是多數散戶相對好切入量化的策略。期貨本身自帶槓桿,一般是10倍以內,這使得小資金也可以嘗試。同時因為期貨的程式化介面特別友好,交易框架也多,所以CTA策略就成為了散戶研究量化的首選。

CTA策略從名字定義上是指商品投資顧問策略,一般是交易商品期貨或股指期貨。策略可以做趨勢跟蹤、

均值迴歸

或套利。市場的主流還是趨勢跟蹤,因此說CTA策略,通常就是指期貨趨勢跟蹤策略。

趨勢跟蹤策略從邏輯來講是靠譜的,並且長期靠譜,只是收益多少和等待時間能不能熬住的問題。市場無非是震盪或趨勢,一般是震盪更多。未來一定是在這兩種行情中來回切換,只是什麼時候切換無法得知。

一個品種不可能永遠走趨勢也不可能永遠震盪(但是可能會震盪很久),時間久了,大行情必定會出現。另外,金融市場的收益分佈普遍認同的是尖峰厚尾,即小機率事件不難發生。直白一點就是大行情還是比較容易出現。

所以,趨勢跟蹤的原理就是天上一定會掉餡餅並且機率不算特別小,掉的時候會掉很多餡餅。但是什麼時候掉不好說,你要保證在餡餅掉下來之前別餓死,開始掉餡餅了就吃飽囤好,然後繼續等待下一次。如果碰到長時間不掉餡餅,所有人都很難熬,但是如果熬過去了,得到的餡餅往往也比較大。

趨勢跟蹤是一種動量策略、做多波動的策略,也就是俗話說的

追漲殺跌

,這種策略不預測行情,它在行情的必經之路上面候著,有點像守株待兔。

有的策略會加訊號過濾,這樣可能會過濾掉一些假訊號,減少震盪時期的虧損,但是有得必有失,過濾訊號有可能會錯過一輪真正的大行情。有的策略會在過濾訊號的同時增加一個二次入場機制,防止錯失行情,但是這也沒辦法完美解決假訊號的問題,因為二次入場訊號也可能是個假訊號。

一般來說,窄幅震盪的行情比較容易過濾,即使不過濾,單次止損金額也不大;

寬幅震盪

比較麻煩,訊號放太窄容易觸發,訊號放太寬也有可能完美觸碰,並且單次止損金額會比較大。寬幅震盪行情是趨勢跟蹤策略的噩夢,全品種寬幅震盪,那就是噩夢中的噩夢了。

平時沒行情的時候,趨勢跟蹤經常會面臨止損,做得不好的策略會一直小虧,做得好的策略不怎麼虧或虧得少,但是當大行情來的時候會有較大的盈利,可以覆蓋掉過往的虧損。表現出低勝率,高盈虧比、不懼怕

黑天鵝

的特點。

來看一下朝陽永續的CTA指數的績效表現,下面的引用是官方的介紹。

朝陽永續聯合市場中31家CTA類或以CTA策略為主且資產管理規模超5億的私募基金管理人,共同打造了中國

私募基金

系列指數之五億私募CTA指數。

這個指數走勢圖代表了國內CTA策略較高水平,因為入選機構的專業水平較高。從淨值曲線也可看出。2015年-2016年底有一波行情,2017年-2019年底多數商品處於震盪期,2019年底至今又走出了一波牛市,震盪期指數的回撤不算大,屬於沒行情期間不怎麼虧錢的情況。

關於量化交易的一些感悟

朝陽永續5億私募cta指數

表面上看策略的絕對收益不大,但是據我瞭解,一般資管機構的倉位都不高,槓桿水平在1-2倍左右,如果可以容忍更大回撤的話,還有加大槓桿的空間。

因為資管對淨值波動的要求和自營是完全不同的,所以資管賬戶通常會更保守。對於個人自營而言,如果你的表現能夠接近這個指數的話,完全可以再加槓桿,以追逐更高的絕對收益。現在流行的MOM模式,其實也是利用了資管軟體分倉功能,間接實現了加槓桿的操作。

CTA策略對

資金量

小的散戶而言,確實比較友好,但是我知乎某個回答裡面有提過,其實資金量對策略收益是有影響的,因為資金量太小能操作的合約就相對有限,透過多品種多策略多合約來降低淨值波動的方式對小資金賬戶就不可行。

很多單品種策略的績效表現可能不會太神奇,但是透過多樣化的方式,整個投資組合也能取得不俗的表現。

程式設計能力一般的可以用TB等商業軟體,基本都能實現回測、引數最佳化、交易執行的一整套工作。程式設計能力再強一點的可以選擇vnpy。對速度或者系統架構有更高要求的自己寫系統也可以,但是我覺得沒這個必要。

趨勢跟蹤策略多數是中低頻策略,對技術要求不高,賺錢與否還是在於策略本身,IT技術的邊際影響是遞減的。因此如果技術特別強的話可以做其他事情,中低頻交易沒必要花時間重構交易執行系統。

關於CTA策略的週期選擇,我認為不要選擇特別高頻率的。頻率超過1h的不要輕易嘗試了,一般基於技術指標類的趨勢跟蹤系統在中高頻上面的訊號有效性都很一般,大部分是噪音,收益相對頻率的提升是遞減的,與此同時,交易成本的提升卻是遞增的。

很多人在回測的時候低估了交易滑點,一般會把滑點設為1個tick。以1h的週期為例,1個tick的滑點一般都不夠,我之前統計過一兩個賬戶,印象中滑點好像是在2個tick附近。交易滑點有可能會達到手續費的幾倍之多。

當你的策略是日線級別的時候,你的滑點不一定會增大多少,但是交易次數少了很多,整體交易成本低了很多。

通常隨便一個趨勢跟蹤系統,均線也好通道也罷,在中低頻的資料裡,只要用引數遍歷大法,尚能擬合出可以接受的淨值曲線(前提是回測區間起碼需要有一個趨勢行情),但是頻率超過1h的策略,往往設定不同的交易成本會帶來大相徑庭的淨值曲線,這些策略即使你遍歷了很多引數組,得到的多數也是穩定虧損的曲線(穩定虧交易成本)。

所以對於剛入門量化的散戶,交易頻率不要太高,還是推薦日線為主。中低頻的歷史回測結果對未來的適用性雖然不確定,但是不確定能否賺錢起碼比確定虧損來的要好。萬一開始跑實盤的時候來一波行情,即使策略一般,賺錢也是大機率事件。

行情來了雙均線10-20的策略都要飛起。當然趨勢跟蹤策略好不好還是看沒行情的時候虧得怎麼樣。

關於股票的量化策略

(評論區有些朋友指出我對股票量化理解有偏差,確實,我自己並沒有從事股票交易,所以是一知半解,為避免誤導其他朋友,大家股票方面的內容隨便看看就好)

股票的量化策略發展歷史應該比較早,畢竟股票的市場容量最大,專業機構沒有理由錯過這個最大市場。股票量化以多因子策略為主。近些年,隨著知名量化私募資金量的擴大,期貨CTA中低頻策略雖然資金容量不算低,但是還是趕不上資金的增長速度,所以這些私募也開始轉戰股票策略。

因子聽上去讓人感覺有些困惑,其實顧名思義就是原因的意思,即某個東西是影響股票收益的原因。比如市值因子,就是說股票市值的大小對股票的未來收益有影響,動量因子,即股票最近的漲跌情況對未來收益有影響,其它什麼行業因子、風格因子以此類推。

因為股票在每個因子下面都有風險暴露,所以整個投資組合也都是有多個因子的風險暴露。但是可以透過金融工具對沖掉某些因子的暴露,做中性處理。比如,投資組合包含了很多

大盤股

,你認為市值大的股票未來會有不錯的收益,但是中國的大盤股有不少是銀行股,你對銀行這個行業信心不足,不太想承擔這裡面的行業風險,而只希望保留市值因子。

如果條件允許你做空銀行ETF的話,你就等於部分對沖了裡面的行業風險。實際上受限於政策和工具,有些因子的中性化並不好實現。當然你也可以簡單粗暴的把銀行股都去掉,保留非銀行大盤股,這也是中性化處理的一種方式。

不同於期貨CTA策略以擇時為主,股票量化策略更多的是選股策略,透過多種因子選出股票,然後定期或不定期做調倉。因子有的會暴露多個,有的會對一些不想要的因子做中性處理。

股票量化策略對資金量要求比較大。股票沒有槓桿,如果透過量化把淨值波動抑制的話,收益也相應被拉低了。對資金量特別大的機構而言,平滑淨值波動,擴大資金容量特別有意義。但是對散戶來說,做股票量化幾乎沒有太大的意義,票太分散,還不如直接買基金。

股票量化我幾乎沒涉獵,只知道一個模糊的大概。

關於期權的波動率策略、類做市策略以及套利類交易

期權相對其它投資品種而言,知識點比較多,如果完全沒有交易過期權或不具備期權基礎知識的人,下面的內容可能看不太懂,這個沒有關係,可以跳過不看。

我是從2019年開始接觸期權,接觸時間不算長,目前還在做主觀的期權交易,主要是交易50和300ETF期權,可以算是單品種多策略的交易。

一般時候,較少裸買和裸賣,以買賣結合為主,賣期權的時候,風控主要是靠賣Call買Put或賣Put買Call的方式,戴一個低成本的保護套。

IV高的時候偏做賣方賺取IV下降的收益;IV在歷史均值附近時,主做一些方向性交易並且部分賣期權來降低買權成本;IV很低的時候基本不怎麼賣期權,但是也比較少裸買或雙買,IV低時常用虛值的牛差,輕微留正delta、正gamma、正vega敞口。

事件驅動前的升波雙買加刮gamma基本不做,事件落地後的降波看IV拉昇情況做一點。

方向性上,對於指數ETF期權,基本不做空,最多就是用低成本或零成本的方式買一些深虛的Put做保護。

期權的波動率策略主要有兩個:

偏度Skew和期限結構Term structure

做波動率策略除了需要關注delta、gamma和vega之外,還需要關注一些二階希臘值,因為波動率套利的交易我做得少,只有特別明顯的機會才做。所以這些二階希臘值我一般都記不住。

但是不管有沒有做波動率交易,幾個比較關鍵的二階希臘值還是要知道的,你可以不知道這些希臘值叫什麼,但是要知道因為這些希臘值的存在,會造成下面幾種情況,因為這幾種情況是發生在時間維度和波動率維度尚,平常看T型報價是體會不到的,所以我特意拿出來說一下:

虛值期權的delta隨著時間流逝越來越趨於0,實值期權則越來越趨於1,虛值期權的delta隨著IV的增大會變大,隨IV減小而變小。

虛值期權和實值期權的gamma隨時間流逝變小,平值期權隨時間流逝變大,虛值期權的gamma隨著IV增大而變大,隨IV減小而變小。

所有期權的vega都會隨時間流逝變小,虛值期權的vega隨著IV增大而變大,隨IV減小而變小。

偏度套利:做同一個月份不同行權價的IV套利,主要做法是如果25%delta的otm期權相對50%的atm期權IV相差超過歷史閾值的時候,就買atm賣otm並定期或不定期的進行delta中性處理。有的做得更精細一點的還會對不同到期日做標準化處理,常用的skew策略是比例價差策略。

期限結構套利:做不同月份的IV套利,主要做法就是看近月期權的IV相比遠月期權的IV是否超過歷史閾值,超過就相應的做買近賣遠或者賣近買遠並且定期或不定期進行delta中性處理。一般規律是出行情了近月的IV漲得比較狠,沒行情了近月的IV跌的比較狠,簡而言之就是近月IV反應更加靈敏一些,常用的期限結構套利主要是日曆價差策略。

雖然這兩種波動率套利策略看上去不難,但是實際上影響盈虧的因素很多。比如在套取兩個期權的IV差的時候,其他的

風險敞口

(比如整體的vega、gamma敞口)是沒辦法完全中性化處理的。

在持倉的過程中始終存在著其他風險暴露,有可能你在IV差上面的收益會被其他風險敞口吃掉了。所以最終即使IV差如你預期迴歸了,但是你也不一定能賺到錢。這是和其他的套利交易不一樣的地方。

有經驗的交易員,一般是看IV差的同時也會結合整體IV、標的行情,進行分批入場和出場。

做期權波動率交易,量化研究肯定是要的,起碼你需要構建歷史資料庫,還需要區分出每個交易日的實值、平值和虛值期權,並計算好對應的希臘值和IV值。工作量還是比較大的。

有了這些資料庫之後,一旦確定好交易策略,手動交易也是可以的,當然專業的機構肯定是直接用程式下單的。通常來說,波動率交易策略是整體IV越高,行情波動越大,交易利潤就越大。IV特別低的時候,所有的期權權利金都很低,套利空間自然小很多。

vnpy的option master模組有一個類做市的電子眼功能,但是波動率套利交易是沒有現成的模組可以使用。如果真的有興趣的話,透過改寫option master、portfolio_strategy、spread_trading這三個模組應該都可能可行。具體的話,還是要去閱讀原始碼,看看哪個模組改起來最方便。這塊因為我覺得利潤比較低(雖然風險也比較低),所以一直都沒有太高的興趣。

說到期權的類做市套利交易,其實就是糾正市場的短時間定價錯誤,一般在交易特別狂熱、有些人不顧一切狂掃價格或者乾脆下錯單,就會出現了價格有利可圖的情況。

因為期權有不同行權日和行權價,單純看

權利金

無法知道這個價格是否合理,就像看股票的價格無法知道是否合理一樣。期權的IV就是標準化的價格,不同行權價不同月份的IV構成了一張波動率曲面。

這個波動率曲面有一定的規律,它的規律是由一些無風險或有風險的套利交易維繫的。因此一旦出現明顯不符合規律的價格時,這個期權的IV就會在曲面上形成一個異常的凸點或凹點,而類做市的系統就是用來抓取這些異常機會的。

從上面的描述可以知道,類做市的核心技術就是要有較強的理論定價能力和強大的IT技術。很抱歉這些都和散戶都沒有太大關係,所以後會有期byebye。雖然vnpy的電子眼有這個功能,但是我個人覺得散戶不好應用。

關於量化交易的一些感悟

波動率曲面。來源谷歌圖片,侵權刪

另外一些量化交易策略是套利交易。

比如期權的無風險PCP套利,以前流行的期貨期現套利。無風險套利我覺得不用嘗試了,因為基本上機構們都已經套得差不多了,沒什麼機會可以留給散戶。

當你發現某個價格有不錯的無風險套利空間的時,一般要麼是根本沒辦法套,要麼是可能哪些因素你沒考慮到,要麼是算上隱形成本(機會成本),其實也沒有很大意義。

而一些有風險的統計類套利交易,存在賺小虧大的情況,並且因為賺錢多數是小筆盈利的累積,如果資金量不大或槓桿不高的話,這個絕對收益難以令人滿意的,所以對於此類交易,散戶也可以跳過。

關於過度擬合

量化交易有不少陷阱在裡面,比較為大家所熟知的主要有:未來函式、倖存者偏差、過度擬合、交易成本、流動性。

未來函式比較容易解決,事件式回測一般不容易出現,向量式回測比較容易出現,但是隻要仔細檢查,一般都能發現邏輯錯誤。

交易成本,一般來說手續費是可以準確估算的,但交易滑點相對不好預估,而且不同策略滑點模型是不一樣的,如果估算不好就會出現高估或低估的情況,不過一般還是低估的情況更多一些。

流動性也是回測的一個問題,比如有的訊號是在漲跌停的位置根本無法成交,有的合約流動性比較差,實盤中較難成交。還有人用非逐筆成交的資料(快照tick)去回測高頻交易,回測都按可以成交計算,這顯然很不合理。因為很多高頻交易的核心是在於你速度夠不夠快,能不能吃到單子。

倖存者偏差和過度擬合是比較陰險的,但是相對過度擬合來說,倖存者偏差就像一個天真燦爛的兒童一樣。過度擬合經常在不知不覺中毒害你。過度擬合的害處主要是精確描繪了過去,但是未來很難重複這麼精確的過去,所以策略就很大機率會失效。

一旦開始做量化研究,就必然存在擬合的問題,只是程度多少而已。量化策略的研究本身就是擬合過去歷史資料的過程。

欠擬合的危害比較小,因為欠擬合的話,回測結果可能不會令人滿意,因此也不會上實盤。但是要上實盤,策略必定是在歷史資料裡面表現較好的,這個時候過度擬合就悄悄的滲入了,過度擬合會讓人誤以為找到了聖盃。

可以說過度擬合到目前為止仍然是量化研究的最大陷阱。完美的解決方法是沒有的,目前常見的思路是下面幾個:

降低未來的預期。

不要根據回測成果去期待未來有對應的收益,尤其是回測結果越漂亮越應該有清醒的認識。歷史會重複的是一些寬泛的東西,比如人性,但是反應到具體的價格圖表上,簡單的形態或模式的重複其實是比較少的。

策略不要加入過多的條件和引數。

天文學家托勒密用了均輪本輪來擬合天體運動軌跡,只要輪的數量多了,就可以擬合出複雜的軌跡了。同理,規則型策略只要引數夠多了,也可以準確擬合出歷史的軌跡,至於深度學習神經網路這種非規則性的黑箱策略,精確擬合曆史資料是易如反掌的事情。

但是預測

天體運動

軌跡和預測市場走勢完全是兩碼事,千萬別這麼做。

資料儘可能多一些,儘可能包含不同的行情。

可以用拉長回測期間、增加測試品種等方式,但是弊端是可能花費很大功夫也只能找到一個平庸的策略。

普遍適用性和優秀的歷史表現不好兼得。其實這仍然是欠擬合和過度擬合的問題,兩者之間的平衡點並不好把握。

如果歷史資料已經包含了很多種市場行情或跑了很多品種,但是你的策略表現似乎都非常完美,能夠適應各種市場環境,那一定要小心,這種情況很可能是用了過於複雜的引數和條件,開啟強力挖掘資料的結果,過度擬合的機率非常大,一般很少有哪種策略可以通吃天下的。

謹慎看待樣本外測試。

樣本外測試用來檢驗策略是否過度擬合不一定靠譜。因為樣本外的資料通常比訓練資料少,對於金融市場這種變幻多端的資料來說,如果樣本外資料和訓練資料相差特別大的話(這種情況太常見了),很容易發生誤判。

比如一些需要較長時間才能看出是否有盈利能力的策略,如果樣本外的時間太短,很容易一棍子打死本來可以的策略。

所以做投資研究,不能高估樣本外測試的作用,樣本外測試比較有用的是在人臉識別、語音識別這些領域。

總之,想要避免過度擬合就有可能因為欠擬合而研發不出好的策略,研發出好策略就一定有過度擬合的風險。

策略研發的核心還是在於思考你的策略能夠盈利的邏輯,強行資料探勘在投資領域絕對不靠譜。

關於回測結果

看回測結果,無非就是想知道這策略行還是不行。

先看下回測的樣本量,如果是中低頻的策略,樣本量不太充足,統計意義不顯著,策略的結果很難說明它未來到底行還是不行。

如果是樣本量比較充足的中高頻交易,策略表現不好的結果比策略表現好的結果更加具有說服力。如果發現它表現不好,在未來很有可能也表現不好。但是如果表現好,並且排除了交易成本方面的偏差後,未來也未必會有類似良好的表現,但是已經可以進入不妨嘗試一下的階段了。

至於高頻交易,一般人還是不要在這上面花心思了,普通tick快照的回測結果沒有任何意義。

回測結果要結合策略的盈虧邏輯看,否則不管結果如何還是無法判斷策略到底可行不可行。每個策略都有它適用的市場行情也有它不適用的市場行情,道理就像飛機天上跑、輪船水裡遊一樣。

在研發策略的時候得知道這個策略在什麼樣的行情下會盈利,在什麼樣的行情下會虧損,然後再看看做回測的歷史資料包含了什麼樣的行情,這種行情在未來是否有重現的可能性。

舉例來說,對於趨勢跟蹤策略,我們知道只要歷史資料中間有一波行情,震盪時間不要太久,一般它的表現都不會太差。如果你的回測資料沒有包含趨勢行情的話,回測結果肯定是不行的,但是你沒辦法斷定這個策略未來不行。反之,如果你的歷史資料就是隻有一波完整的大牛市,那真的是貓狗都要飛上天了,未來碰到震盪了再優秀的策略也只能吃土。

如果你能明確知道趨勢跟蹤的盈虧邏輯後,再看一下回測區間的歷史資料包含了什麼行情,就能對回測結果有一個清晰的判斷了。

其實說到底,還是和上一節說的一樣,好好思考交易策略的盈虧邏輯,再結合歷史資料來看待回測結果。

關於機器學習

機器學習在金融領域的最大弊端還是過度擬合。

這幾年機器學習比較熱門,很多專業的量化私募也開始佈局這塊,當然這裡面也有不少私募純粹就是打著機器學習的噱頭吸引資金的。

機器學習裡面的深度學習、神經網路在模式特徵識別上確實大放異彩,但是投資交易並不是嚴謹的自然科學,其複雜程度遠超這些領域。

市場並不是一成不變的固定模式,機器學習這種用歷史資料去學習規則的方式,永遠只會學習出過去的模式。技術分析的支持者認為,歷史會重複(雖然不是簡單重複),這是技術分析有效的根基之一,而其實這更是機器學習這種模式能夠有效的根基。

機器學習的優勢是可以透過海量資料精確擬合曆史的特徵,這很難不陷入過度擬合的陷阱。過度擬合對未來交易沒有太大幫助這應該是量化常識了。

如果認為不能過度擬合,而應該只抓取一些不變的東西(比如人性、群體不理性等),這其實是一種欠擬合,欠擬合根本沒有必要用到機器學習,普通的規則性交易系統甚至是主觀交易模糊的規律都足夠適用。

關於量化交易的一些感悟

市場模式變化示例,來源谷歌圖片,侵權刪

所以我個人認為,機器學習在中低頻的量化交易上面並沒有什麼幫助,只會讓你陷入過度擬合不能自拔。

而在高頻交易領域,比如股票T+0(其實嚴格來講也不能算高頻交易,這裡暫且放寬高頻的定義),機器學習或許有一定的作用。

因為我曾經做過一段時間的人工股票T+0交易,人工T+0在穩定盈利上面是毋庸置疑的,這是有大量的實踐支撐的。因此可以推斷出人腦在這種糾正短時定價錯誤的交易上面,確實能夠識別出一些共性並且一直相對不變的東西。

也就是說在日內交易上面,或許確實存在著相對不變的盈利模式,而這種模式用條件或規則很難定義,機器學習這種從資料倒推規則的黑箱方式可能就恰好適用,尤其是深度學習神經網路這種本身就是借鑑人腦的方法。

不過這種模式下,機器學習可能需要不斷的更新資料,不斷的調參,人腦在應對市場變化反應肯定是更快的,並且人腦可能還多了一個訊息面的維度。這個維度,機器學習目前估計比較難用上。長期來看,我還是更看好人工交易員在T+0領域的績效表現。

以前我在學習機器學習基礎知識的時候,對一句話印象比較深刻。原話記不住了,大概意思是人類專家解決不了的問題,機器學習也解決不了。而投資領域,恰恰是這樣,或許有不少大佬在投資上面賺了很多錢,但是誰也不敢說這裡面沒有一點運氣成分,誰也不敢保證自己的過往經歷就是永恆的聖盃。其實,現在也有不少人認同社會科學領域沒有專家這個觀點。

總結來說,就是機器學習在高頻領域或許有一席之地,在中低頻交易上面用處不太大。從行業看,實打實用機器學習做交易的機構應該有,但是不多,更多的只是把機器學習當作一種吸引資金的噱頭。

關於一些建議

本來作為一個不算成功的量化研究愛好者看似不應該給出什麼建議,但是也不妨寫寫,希望對一些和我有著相似經歷的朋友能有一點幫助吧。

當然每個人都應該經過自己的獨立思考再來看待這些建議。不管是誰,不管他的財富地位如何,每個人都受限於自己的認知和經歷,都有可能丟擲一些錯誤的觀點,不用踩低不成功的人也不必迷信大佬。

先說下我自己的經歷:我畢業於某理工大學,但是我的專業其實是文科專業,2013年左右開始接觸金融,但是與交易無關,主要是運營類的工作,2017年才開始自學接觸交易,現在就職於小型的私募公司,不過公司並無量化方面的研究,因此量化研究仍然是業餘的,主觀交易主要是做ETF期權,後續主要思路是期貨期權結合做中長線的交易。

如果是知名院校、有深厚的數理功底及強大的程式設計能力的人,可以考慮一些知名頭部私募或網際網路公司的資料分析工作。

如果經歷和我類似,想在專業量化私募機構就職並不太容易。頭部量化私募一般都要求名校研究生應屆畢業,並且對數理和程式設計能力有較高要求,小型私募則是要有能直接賺錢的策略,通常需要提供不錯的實盤業績。

類似於我這樣半路出家的,這兩個條件都不具備,最有可能的路徑是用自己的資金做自營。

1、做自營要不要全職做?

投資交易存在諸多不確定性,長週期的穩定盈利相對有可能,但是想像工作一樣,每個月都穩定的現金流入則比較困難。

此外選擇做量化的人,一般風險偏好不會太高,不是那種一把梭哈贏了會所嫩模輸了下海乾活的人。風險偏好不高自然預期收益也不會太高,如果可投資的資金量太小,絕對收益可能難以應對支出。

所以如果家庭壓力比較大、需要每個月有穩定的現金流入、並且可用於投資的資金量不大的話,即使現在的崗位收入不是特別高,都不要考慮全職做量化。

尤其是一些能力很不錯、現有工作待遇好的專職程式設計師,雖然你們的程式設計能力讓你們很容易切換到這個崗位,但是真心不建議放棄高薪辭職來專職做量化。

量化研究交易或者主觀交易都是完全可以兼職做的,擁有穩定的現金流入最重要,雖然知乎確實也有不少堅持下來最後成功的交易者,但是個中的壓力我覺得多數人都難以承受。

如果是手上有不少積累的閒置資金,並且生活沒有太大壓力的,不妨可以嘗試一下,如果能穩定複利的話,這些起始資金帶來的投資收益也較為可觀。

2、從哪裡入手?

最好入門的還是CTA趨勢跟蹤策略,資金要求低,技術門檻低、可用的交易介面和框架多。股票多因子策略、統計套利策略資金量太小做了沒什麼意義。期權交易感興趣的可以做,但是建議先從主觀交易做起。高頻交易基本不用考慮。

我目前已經沒有研發CTA策略了,因為特別優秀的策略研發不出來,囧。拿了一點錢去投了朋友的MOM產品,開始還有點不甘心,明明自己就是CTA策略研發人員。後面發現這樣的做法才是明智的。產品有槓桿,幾乎涵蓋了所有品種,策略多樣化,當然因為小資金所以是寄放在信得過的朋友名下。如果我自己跑策略的話,麻煩事小,主要是資金小,策略限制太多了,

這裡可以給沒做過CTA策略的朋友提供一些思路:

做中長線交易,手續費和滑點的影響比較小;

以雙均線或海龜策略作為基準比較策略,回測時間放長一點、回測品種多做一點,只要你的策略平均的統計資料可以超越這個基準策略就可以採用了。趨勢跟蹤就是熬住震盪期等行情,行情來了都能賺。

特別優秀的單品種策略我也沒研發過,一般趨勢跟蹤系統無非就是均線系統、通道系統,然後相應做些修改。

資金量也不能太小,起碼相關性較弱的小合約的品種能做個10個以上,如果你的資金只夠做1手螺紋鋼的話,那還是一把梭哈吧。

最後,猜猜我這幾年收益率最高的策略是什麼策略?

答案是:股票基金定投策略。策略投入精力:0,策略投入時間:0,策略收益排名:NO。1。

我十年前就開始定投股票型基金了,然後隨著收入的增長逐漸增加定投金額,最早每月的定投支出只有300元。

前段時間用年金公式倒推計算了一下

複合收益率

,幾個主動管理型的基金複合收益在17%-23%之間,被動的指數型基金大約在11%左右。可見近十年,中國公募基金的超額收益還是比較明顯的。

我認為

基金定投

的主要盈利邏輯有兩點:1、經濟長期向上。2、只要你能一直定投就等於是無限資金,已經無限子彈了,這種類網格的策略你怕啥。

以上就是全部的感悟,一定有認知錯誤的地方,歡迎指正。

最後總結一下:

五一勞動節

快樂!

標簽: 策略  量化  交易  iv  擬合