首发于强化学习基础David Silver笔记

2. 马尔科夫决策过程(MDPs)

2. 马尔科夫决策过程(MDPs)

南京大学计算机科学与技术博士在读

本系列文章来自David Silver 的网络公开课。若有问题，欢迎交流
link:Teaching
原创内容，转载请联系作者。

编辑于 2018-09-08 21:37

强化学习 (Reinforcement Learning)

深度学习（Deep Learning）

文章被以下专栏收录

强化学习基础David Silver笔记

专栏内容: 1. David Silver 课程笔记 [1-7]; 2. 经典论文阅读笔记