章节3:PolicyGradient策略梯度.txt

/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节3:PolicyGradient策略梯度/章节3:PolicyGradient策略梯度.txt
迅雷云盘 文档 / 704 B 2025-10-20

38:策略梯度PG_同一个回合中不同的action回溯不同的TotalReward_代码实战.mp4

/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节3:PolicyGradient策略梯度/38:策略梯度PG_同一个回合中不同的action回溯不同的TotalReward_代码实战.mp4
迅雷云盘 视频 / 30.66 MB 2025-10-20

37:策略梯度PG_对TotalReward进行均值归一化.mp4

/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节3:PolicyGradient策略梯度/37:策略梯度PG_对TotalReward进行均值归一化.mp4
迅雷云盘 视频 / 29.71 MB 2025-10-20

36:代码实战_策略梯度PG选择行为和参数训练.mp4

/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节3:PolicyGradient策略梯度/36:代码实战_策略梯度PG选择行为和参数训练.mp4
迅雷云盘 视频 / 32.87 MB 2025-10-20

35:代码实战_策略梯度PG网络构建.mp4

/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节3:PolicyGradient策略梯度/35:代码实战_策略梯度PG网络构建.mp4
迅雷云盘 视频 / 28.63 MB 2025-10-20

32:策略梯度PG_总结整体流程_对比交叉熵损失函数求导.mp4

/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节3:PolicyGradient策略梯度/32:策略梯度PG_总结整体流程_对比交叉熵损失函数求导.mp4
迅雷云盘 视频 / 30.01 MB 2025-10-20

34:代码实战_策略梯度PG和CartPole交互.mp4

/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节3:PolicyGradient策略梯度/34:代码实战_策略梯度PG和CartPole交互.mp4
迅雷云盘 视频 / 44.45 MB 2025-10-20

29:策略梯度PG_对比基于值和基于策略网络的区别.mp4

/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节3:PolicyGradient策略梯度/29:策略梯度PG_对比基于值和基于策略网络的区别.mp4
迅雷云盘 视频 / 36.1 MB 2025-10-20

30:策略梯度PG_明确目标函数和导函数.mp4

/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节3:PolicyGradient策略梯度/30:策略梯度PG_明确目标函数和导函数.mp4
迅雷云盘 视频 / 33.85 MB 2025-10-20

31:策略梯度PG_简化导函数的公式推导.mp4

/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节3:PolicyGradient策略梯度/31:策略梯度PG_简化导函数的公式推导.mp4
迅雷云盘 视频 / 33.34 MB 2025-10-20

33:策略梯度PG_讲解CartPole环境.mp4

/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节3:PolicyGradient策略梯度/33:策略梯度PG_讲解CartPole环境.mp4
迅雷云盘 视频 / 31.95 MB 2025-10-20

11 条记录 • 第 1 页 • 共 1