您當前的位置:首頁 > 攝影

為什麼GAN 強化學習這麼難訓練,其瓶頸是什麼?

作者:由 mi2333 發表于 攝影時間:2020-02-27

為什麼GAN 強化學習這麼難訓練,其瓶頸是什麼?知乎使用者2020-03-07 17:06:53

GAN和強化學習很像,不知道你是要問哪一個。不過深度強化學習的泡沫最近也是鬧得比較火,Deep Reinforcement Learning Doesn‘t Work Yet中說了DRL存在的一些問題,包括

樣本利用率非常低;

最終表現不夠好,經常比不過基於模型的方法;

好的獎勵函式難以設計;

難以平衡“探索”和“利用”,以致演算法陷入區域性極小;

對環境的過擬合;

災難性的不穩定性

諸如此類的問題造成了強化學習的難以訓練。

為什麼GAN 強化學習這麼難訓練,其瓶頸是什麼?知乎使用者2020-06-06 10:55:00

強化學習的兩個終極問題:1。 弱歸納偏差 2。 增量學習固有問題

雖然強化學習似乎被Deepmind過於誇大,但是我覺得強化學習的思想非常好,可以作為我們解決問題的一個總體框架。

標簽: 學習  強化  難以  問題  GAN