2. 马尔科夫决策过程(MDPs)陈雄辉南京大学 计算机科学与技术博士在读本系列文章来自David Silver 的网络公开课。若有问题,欢迎交流link:Teaching原创内容,转载请联系作者。编辑于 2018-09-08 21:37强化学习 (Reinforcement Learning)机器学习深度学习(Deep Learning)赞同 3813 条评论分享喜欢收藏申请转载