演算法過程如下,先使用 DIAYN 得到一個判別器(其實就是得到一族有意義的獎勵函式,或者一族自動生成的 MDP),然後在這一族任務中使用 model-agnostic meta-learning (MAML) 來學習