為什麼GAN 強化學習這麼難訓練，其瓶頸是什麼？

作者：由 mi2333 發表于攝影時間：2020-02-27

知乎使用者2020-03-07 17:06:53

GAN和強化學習很像，不知道你是要問哪一個。不過深度強化學習的泡沫最近也是鬧得比較火，Deep Reinforcement Learning Doesn‘t Work Yet中說了DRL存在的一些問題，包括

樣本利用率非常低；

最終表現不夠好，經常比不過基於模型的方法；

好的獎勵函式難以設計；

難以平衡“探索”和“利用”，以致演算法陷入區域性極小；

對環境的過擬合；

災難性的不穩定性

諸如此類的問題造成了強化學習的難以訓練。

知乎使用者2020-06-06 10:55:00

強化學習的兩個終極問題：1。弱歸納偏差 2。增量學習固有問題

雖然強化學習似乎被Deepmind過於誇大，但是我覺得強化學習的思想非常好，可以作為我們解決問題的一個總體框架。

標簽：學習強化難以問題 GAN

猜你喜歡