陪你度过漫长岁月


  • 首页

  • 归档

  • 标签
陪你度过漫长岁月

源码阅读《PyTorch PPO》

发表于 2018-10-09 | 分类于 源码阅读 |
基于PyTorch的PPO的源码阅读
阅读全文 »
陪你度过漫长岁月

技术总结《配置Vim》

发表于 2018-09-27 | 分类于 技术总结 |
关于配置Vim的一些技术总结
阅读全文 »
陪你度过漫长岁月

学习总结《Guided Policy Search》

发表于 2018-05-17 | 分类于 学习总结 |
一种Model-Based的强化学习算法
阅读全文 »
陪你度过漫长岁月

学习总结《神经网络常用求导》

发表于 2018-03-31 | 分类于 学习总结 |
神经网络常用求导
阅读全文 »
陪你度过漫长岁月

技术总结《OpenAI Gym》

发表于 2018-03-26 | 分类于 技术总结 |
关于OpenAI Gym的一些技术总结
阅读全文 »
陪你度过漫长岁月

论文笔记《Prioritized Experience Replay》

发表于 2018-03-18 | 分类于 论文笔记 |
优化experience replay的一种方法
阅读全文 »
陪你度过漫长岁月

论文笔记《Scalable trust-region method for deep reinforcement learning using Kronecker-factored approximation》

发表于 2018-02-26 | 分类于 论文笔记 |
将K-FAC用到Actor-Critic框架中的算法
阅读全文 »
陪你度过漫长岁月

学习总结《强化学习与深度强化学习》

发表于 2018-02-03 | 分类于 学习总结 |
关于强化学习与深度强化学习的一些理解与总结
阅读全文 »
陪你度过漫长岁月

课程笔记《UCL强化学习》

发表于 2017-09-09 | 分类于 课程笔记 |
UCL David Silver的强化学习课程
阅读全文 »
陪你度过漫长岁月

课程笔记《Learning How to Learn》

发表于 2017-09-09 | 分类于 课程笔记 |
关于学习方法的一门课程
阅读全文 »
1234
Criss

Criss

Talk is cheap

35 日志
9 分类
46 标签
© 2024 Criss
由 Hexo 强力驱动
主题 - NexT.Mist