|
介绍:
第1章强化学习基本原理1小时42分钟10节;
1-1强化学习简介09:34
1-2强化学习基本概念 09:55
1-3马尔科夫决策过程 09:06
1-4Bellman方程 12:22
1-5值迭代求解 08:12
1-6代码实战求解过程 11:14
1-7QLearning基本原理 10:00
1-8QLearning迭代计算实例 11:07
1-9QLearning迭代效果 08:59
1-10求解流程详解 11:42
第2章强化学习项目实战-DQN让AI自己玩游戏1小时38分钟11节
2-1DeepQnetwork原理 06:38
2-2DQN网络细节 11:00
2-3DQN网络参数配置 08:23
2-4搭建DQN网络模型 11:31
2-5DQN卷积操作定义 10:07
2-6数据预处理 11:42
2-7实验阶段数据存储 08:18
2-8实现训练模块 10:50
2-9Debug解读训练代码 05:05
2-10完整代码流程分析 11:33
2-11DQN效果演示 03:11
|
|