论文笔记《Scalable trust-region method for deep reinforcement learning using Kronecker-factored approximation》 发表于 2018-02-26 | 分类于 论文笔记 | 将K-FAC用到Actor-Critic框架中的算法 阅读全文 »