源码阅读《PyTorch PPO》

发表于 2018-10-09 | 分类于源码阅读 |

基于PyTorch的PPO的源码阅读

阅读全文 »

技术总结《配置Vim》

发表于 2018-09-27 | 分类于技术总结 |

关于配置Vim的一些技术总结

阅读全文 »

学习总结《Guided Policy Search》

发表于 2018-05-17 | 分类于学习总结 |

一种Model-Based的强化学习算法

阅读全文 »

学习总结《神经网络常用求导》

发表于 2018-03-31 | 分类于学习总结 |

神经网络常用求导

阅读全文 »

技术总结《OpenAI Gym》

发表于 2018-03-26 | 分类于技术总结 |

关于OpenAI Gym的一些技术总结

阅读全文 »

论文笔记《Prioritized Experience Replay》

发表于 2018-03-18 | 分类于论文笔记 |

优化experience replay的一种方法

阅读全文 »

论文笔记《Scalable trust-region method for deep reinforcement learning using Kronecker-factored approximation》

发表于 2018-02-26 | 分类于论文笔记 |

将K-FAC用到Actor-Critic框架中的算法

阅读全文 »

学习总结《强化学习与深度强化学习》

发表于 2018-02-03 | 分类于学习总结 |

关于强化学习与深度强化学习的一些理解与总结

阅读全文 »

课程笔记《UCL强化学习》

发表于 2017-09-09 | 分类于课程笔记 |

UCL David Silver的强化学习课程

阅读全文 »

课程笔记《Learning How to Learn》

发表于 2017-09-09 | 分类于课程笔记 |

关于学习方法的一门课程

阅读全文 »