為什麼GAN 強化學習這麼難訓練,其瓶頸是什麼?
作者:由 mi2333 發表于 攝影時間:2020-02-27
GAN和強化學習很像,不知道你是要問哪一個。不過深度強化學習的泡沫最近也是鬧得比較火,Deep Reinforcement Learning Doesn‘t Work Yet中說了DRL存在的一些問題,包括
樣本利用率非常低;
最終表現不夠好,經常比不過基於模型的方法;
好的獎勵函式難以設計;
難以平衡“探索”和“利用”,以致演算法陷入區域性極小;
對環境的過擬合;
災難性的不穩定性
諸如此類的問題造成了強化學習的難以訓練。
強化學習的兩個終極問題:1。 弱歸納偏差 2。 增量學習固有問題
雖然強化學習似乎被Deepmind過於誇大,但是我覺得強化學習的思想非常好,可以作為我們解決問題的一個總體框架。
上一篇:認識中性色 - 知乎
下一篇:生活平平淡淡是好事嗎?