62:代码实战_PPO与环境整体交互_Actor与Critic网络构建.mp4

/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节5:DDPG、PPO、DPPO算法/62:代码实战_PPO与环境整体交互_Actor与Critic网络构建.mp4
迅雷云盘 视频 / 28.52 MB 2025-10-20

63:代码实战_定义PPO1和PPO2不同版本Actor的Loss计算逻辑.mp4

/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节5:DDPG、PPO、DPPO算法/63:代码实战_定义PPO1和PPO2不同版本Actor的Loss计算逻辑.mp4
迅雷云盘 视频 / 36.15 MB 2025-10-20

61:PPO_PPO1、TRPO、PPO2三种不同的方式解决两个分布不同的问题.mp4

/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节5:DDPG、PPO、DPPO算法/61:PPO_PPO1、TRPO、PPO2三种不同的方式解决两个分布不同的问题.mp4
迅雷云盘 视频 / 32.5 MB 2025-10-20

60:PPO_重要性采样的问题_期望矫正但是方差还是不同带来的问题.mp4

/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节5:DDPG、PPO、DPPO算法/60:PPO_重要性采样的问题_期望矫正但是方差还是不同带来的问题.mp4
迅雷云盘 视频 / 34.49 MB 2025-10-20

59:PPO_通过重要性采样使得PPO可以做Off-Policy学习.mp4

/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节5:DDPG、PPO、DPPO算法/59:PPO_通过重要性采样使得PPO可以做Off-Policy学习.mp4
迅雷云盘 视频 / 32.08 MB 2025-10-20

58:PPO_强调AC如何输出连续型动作_区分On-Policy与Off-Policy.mp4

/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节5:DDPG、PPO、DPPO算法/58:PPO_强调AC如何输出连续型动作_区分On-Policy与Off-Policy.mp4
迅雷云盘 视频 / 34.69 MB 2025-10-20

55:代码实战_DDPG_Critic网络构建_Actor网络链式求导.mp4

/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节5:DDPG、PPO、DPPO算法/55:代码实战_DDPG_Critic网络构建_Actor网络链式求导.mp4
迅雷云盘 视频 / 50.11 MB 2025-10-20

56:代码实战_DDPG_与环境之间的互动_AC训练调整参数_效果展示.mp4

/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节5:DDPG、PPO、DPPO算法/56:代码实战_DDPG_与环境之间的互动_AC训练调整参数_效果展示.mp4
迅雷云盘 视频 / 38.76 MB 2025-10-20

57:TD3_使用DoubleNetwork优化DDPG.mp4

/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节5:DDPG、PPO、DPPO算法/57:TD3_使用DoubleNetwork优化DDPG.mp4
迅雷云盘 视频 / 57.07 MB 2025-10-20

54:代码实战_DDPG_构建Actor和Critic四个网络_定义Critic求loss和求梯度的逻辑.mp4

/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节5:DDPG、PPO、DPPO算法/54:代码实战_DDPG_构建Actor和Critic四个网络_定义Critic求loss和求梯度的逻辑.mp4
迅雷云盘 视频 / 45.45 MB 2025-10-20

53:DDPG解决DQN不能输出连续型动作的问题_DDPG如何训练Actor和Critic.mp4

/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节5:DDPG、PPO、DPPO算法/53:DDPG解决DQN不能输出连续型动作的问题_DDPG如何训练Actor和Critic.mp4
迅雷云盘 视频 / 43.4 MB 2025-10-20

章节5:DDPG、PPO、DPPO算法.txt

/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节5:DDPG、PPO、DPPO算法/章节5:DDPG、PPO、DPPO算法.txt
迅雷云盘 文档 / 704 B 2025-10-20

67:代码实战_DPPO_GlobalPPO和Workers交替执行.mp4

/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节5:DDPG、PPO、DPPO算法/67:代码实战_DPPO_GlobalPPO和Workers交替执行.mp4
迅雷云盘 视频 / 48.49 MB 2025-10-20

66:代码实战_DPPO_创建一个PPO和多个Worker_创建多线程.mp4

/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节5:DDPG、PPO、DPPO算法/66:代码实战_DPPO_创建一个PPO和多个Worker_创建多线程.mp4
迅雷云盘 视频 / 33.08 MB 2025-10-20

64:代码实战_剖析PPO代码中如何体现Off-Policy的学习方式_效果展示.mp4

/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节5:DDPG、PPO、DPPO算法/64:代码实战_剖析PPO代码中如何体现Off-Policy的学习方式_效果展示.mp4
迅雷云盘 视频 / 34.44 MB 2025-10-20

65:DPPO分布式PPO.mp4

/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节5:DDPG、PPO、DPPO算法/65:DPPO分布式PPO.mp4
迅雷云盘 视频 / 36.43 MB 2025-10-20

16 条记录 • 第 1 页 • 共 1