回測前確認(rèn)你所使用的資料是可以信任的[程序化老手]
對于實(shí)際交易美國商品期貨的朋友來說,其中一個(gè)很重要的課題是要找到正確的資料序列來作回測。因?yàn)樵诿绹唐菲谪浀臍v史裡面,最早的交易型態(tài)是由一堆交易員,在交易所裡面用人工喊價(jià)的方式來作價(jià)格的搓合的,那時(shí)候還沒有電子型態(tài)的交易,所以沒有電子盤的資料。所以對于歷史比較悠久的商品來說,比較久遠(yuǎn)前的資料(以黃金為例,是約略在2002年以前)都是只有人工盤的資料。
后來等到約在2002年開始,美國交易所開始引進(jìn)的電子搓合的交易方式,但是限制電子盤的交易時(shí)間只有在人工盤以外的時(shí)間才有,所以約略在2002年到2006年12月的這段時(shí)間,是屬于美國時(shí)間8:20am-1:30pm採人工盤交易,其馀時(shí)間採電子盤交易的型態(tài)。
等到2006年12月開始,電子盤的交易時(shí)間延長到包含到人工盤的交易時(shí)間了。所以從這時(shí)候開始,電子盤的成交量開始大增,雖然人工盤的交易還是存在,但是大家漸漸的把戰(zhàn)場移轉(zhuǎn)到了電子盤上面。
因?yàn)橛羞@樣的歷史典故,所以美國期貨商品的歷史資料也有分為1.人工盤 2.電子盤的資料。
所以如果我們只用人工盤的資料來回測的話,雖然在2006年以前的資料很完整,但是在2006年以后的資料型態(tài),其實(shí)跟現(xiàn)在市場的型態(tài)已經(jīng)有很大的不同了(因?yàn)榇蠹叶寂軄黼娮颖P交易)。
而如果只用電子盤的資料來交易的話,那也只能適用于2006年12月以后的資料,這樣對于回測的時(shí)間長度來說,實(shí)在是太短了。因?yàn)樵?006年12月以前的資料,會(huì)發(fā)現(xiàn)每天中間空了很大一塊(像黃色圓圈所示)。
那如果我們直接把電子盤和人工盤的資料拼在一起的話,是不是就可以代表完整的資料了呢?
其實(shí)這樣做也不行,因?yàn)樵?:30am-1:30pm的這段時(shí)間,雖然人工盤和電子盤同時(shí)交易,理論上兩者的價(jià)格會(huì)相近(因?yàn)橛腥颂桌菍?shí)際上還是會(huì)有些許的差異。再加上如果我們的資料採用了back adjust的方式去調(diào)整的話,因?yàn)槿斯けP和電子盤每次換倉所調(diào)整的值,都會(huì)有一點(diǎn)點(diǎn)的差距。所以累積下來,就會(huì)發(fā)現(xiàn)如果直接把這兩種資料拼在一起的話,會(huì)有K線連不起來的情形(藍(lán)色圓圈所示)。
在Tradestation裡面,電子盤的資料就用@GC來表示(圖片裡最上面那一列的資料序列),人工盤的資料就用 @GC.P表示(第二列的資料序列)。把人工盤和電子盤用暴力法拼湊起來的資料則是第三列的資料序列。最后下方把人工盤和電子盤巧妙的連結(jié)在一起,不要產(chǎn)生莫名其妙的跳空or K線的話,就用 @GC.C來表示(第四列的資料序列)。
所以像黃金這樣狀況的商品,還包含了白銀,天然氣,原油,黃豆,玉米,小麥,大SP500,大道瓊,大Nasdaq等。在回測這些商品的時(shí)候,應(yīng)該要用@GC.C , @CL.C , @SI.C, @S.C, @C.C, @W.C, @SP.C 這些符號才好。如果單純只用@GC來回測的話(沒有加上.C的話),會(huì)發(fā)現(xiàn)這個(gè)資料在2006年12月以前和以后的個(gè)性完全不一樣。如果有人是用IB的歷史資料,或是證券商的歷史資料的話,則需要先確定他們的資料是屬于哪一種。( www.kzuj.com.cn )
但是至于e-mini S&P500的資料(),因?yàn)檫@個(gè)商品一開始就是直接用電子盤交易了,所以沒有@ES.P和@ES.C的問題,直接用@ES來測試就可以了。
以前我念計(jì)算機(jī)概論的時(shí)候,老師講電腦處理資料的特性是, Garbage In, Garbage Out。所以想要信任回測出來的績效,請先確認(rèn)你所使用的資料是可以信任的。謝謝。
有思路,想編寫各種指標(biāo)公式,程序化交易模型,選股公式,預(yù)警公式的朋友
可聯(lián)系技術(shù)人員 QQ: 511411198 進(jìn)行 有償 編寫!(不貴!點(diǎn)擊查看價(jià)格!)
- 上一篇:Group Control 模型-資金管理模型研究
- 下一篇:沒有了!
相關(guān)文章
-
沒有相關(guān)內(nèi)容