相关资源
6:SARSA算法和Q learning算法.mp4
迅雷云盘
39.56 MB
章节1:Q Learning与SARSA算法
迅雷云盘
0 B
1:强化学习通过智能体与环境交互进行学习.mp4
迅雷云盘
44.67 MB
4:蒙特卡洛采样回溯计算V值.mp4
迅雷云盘
41.14 MB
13:代码实战SarsaLambda_训练模型.mp4
迅雷云盘
36.83 MB
7:理解Q table_创建maze交互环境.mp4
迅雷云盘
40.23 MB
12:代码实战Sarsa_Agent选择行为和训练模型.mp4
迅雷云盘
37.68 MB
5:蒙特卡洛和时序差分估算状态V值.mp4
迅雷云盘
44.02 MB
11:代码实战Sarsa_Agent和Env整体交互.mp4
迅雷云盘
26.78 MB
3:详解Q值和V值以及它们之间关系.mp4
迅雷云盘
48.04 MB