发 帖  
经验: 积分:4
讲师 浙江大学
北京市 房山区 学术研究/学生
  • 0

    时间安排大  纲具体内容实操案例三天关键点1.强化学习的发展历程2.马尔可夫决策过程3.动态规划4.无模型预测学习5.无模型控制学习6.价值函数逼近7.策略梯度方法8.深度强化学习-DQN算法系列9.深度策略梯度-D ...
ta 的专栏
关闭

站长推荐 上一条 /6 下一条

返回顶部