DIAYN

您當前的位置：首頁 > 標簽>DIAYN

【強化學習 77】DIAYN
演算法過程如下，先使用 DIAYN 得到一個判別器（其實就是得到一族有意義的獎勵函式，或者一族自動生成的 MDP），然後在這一族任務中使用 model-agnostic meta-learning （MAML）來學習
2019-06-26標簽：策略學習 DIAYN Meta 給定
閱讀更多