對應時間序列的資料集如何進行交叉驗證?
作者:由 匿名使用者 發表于 書法時間:2016-01-19
我也很想知道這個問題的答案。
個人理解,如果是一些傳統的時間序列模型,比如ARMA,本身就是從過去外推到未來的。這樣就沒有交叉驗證的意義。
但有些時間序列問題,可以轉化為普通的迴歸問題形式。那樣子貌似就可以交叉驗證。至於訓練集和驗證集怎麼劃分,可能還有技巧。
一般時間步長比較小,行與行之間資料差異小,那隨機劃分有可能出現數據洩露。也就是說驗證集與訓練集相比有些樣本太相似了。會得到過於樂觀甚至過擬合的結果。
但是如果按照時段劃分,又回到當初的問題。會出現拿未來資料建模,預測過去的現象。當然傳統統計學一直在講平穩。是否意味著把時間序列倒序是不是也沒什麼區別呢。
這個還是請大神來回答吧。
固定視窗交叉驗證,遞增視窗交叉驗證
Rolling Origin Evaluation
上一篇:這,才是我選的黃酒