共找到 16 个文档资源
62:代码实战_PPO与环境整体交互_Actor与Critic网络构建.mp4
/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节5:DDPG、PPO、DPPO算法/62:代码实战_PPO与环境整体交互_Actor与Critic网络构建.mp4
迅雷云盘
视频 / 28.52 MB
2025-10-20
63:代码实战_定义PPO1和PPO2不同版本Actor的Loss计算逻辑.mp4
/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节5:DDPG、PPO、DPPO算法/63:代码实战_定义PPO1和PPO2不同版本Actor的Loss计算逻辑.mp4
迅雷云盘
视频 / 36.15 MB
2025-10-20
61:PPO_PPO1、TRPO、PPO2三种不同的方式解决两个分布不同的问题.mp4
/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节5:DDPG、PPO、DPPO算法/61:PPO_PPO1、TRPO、PPO2三种不同的方式解决两个分布不同的问题.mp4
迅雷云盘
视频 / 32.5 MB
2025-10-20
60:PPO_重要性采样的问题_期望矫正但是方差还是不同带来的问题.mp4
/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节5:DDPG、PPO、DPPO算法/60:PPO_重要性采样的问题_期望矫正但是方差还是不同带来的问题.mp4
迅雷云盘
视频 / 34.49 MB
2025-10-20
59:PPO_通过重要性采样使得PPO可以做Off-Policy学习.mp4
/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节5:DDPG、PPO、DPPO算法/59:PPO_通过重要性采样使得PPO可以做Off-Policy学习.mp4
迅雷云盘
视频 / 32.08 MB
2025-10-20
58:PPO_强调AC如何输出连续型动作_区分On-Policy与Off-Policy.mp4
/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节5:DDPG、PPO、DPPO算法/58:PPO_强调AC如何输出连续型动作_区分On-Policy与Off-Policy.mp4
迅雷云盘
视频 / 34.69 MB
2025-10-20
55:代码实战_DDPG_Critic网络构建_Actor网络链式求导.mp4
/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节5:DDPG、PPO、DPPO算法/55:代码实战_DDPG_Critic网络构建_Actor网络链式求导.mp4
迅雷云盘
视频 / 50.11 MB
2025-10-20
56:代码实战_DDPG_与环境之间的互动_AC训练调整参数_效果展示.mp4
/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节5:DDPG、PPO、DPPO算法/56:代码实战_DDPG_与环境之间的互动_AC训练调整参数_效果展示.mp4
迅雷云盘
视频 / 38.76 MB
2025-10-20
57:TD3_使用DoubleNetwork优化DDPG.mp4
/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节5:DDPG、PPO、DPPO算法/57:TD3_使用DoubleNetwork优化DDPG.mp4
迅雷云盘
视频 / 57.07 MB
2025-10-20
54:代码实战_DDPG_构建Actor和Critic四个网络_定义Critic求loss和求梯度的逻辑.mp4
/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节5:DDPG、PPO、DPPO算法/54:代码实战_DDPG_构建Actor和Critic四个网络_定义Critic求loss和求梯度的逻辑.mp4
迅雷云盘
视频 / 45.45 MB
2025-10-20
53:DDPG解决DQN不能输出连续型动作的问题_DDPG如何训练Actor和Critic.mp4
/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节5:DDPG、PPO、DPPO算法/53:DDPG解决DQN不能输出连续型动作的问题_DDPG如何训练Actor和Critic.mp4
迅雷云盘
视频 / 43.4 MB
2025-10-20
章节5:DDPG、PPO、DPPO算法.txt
/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节5:DDPG、PPO、DPPO算法/章节5:DDPG、PPO、DPPO算法.txt
迅雷云盘
文档 / 704 B
2025-10-20
67:代码实战_DPPO_GlobalPPO和Workers交替执行.mp4
/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节5:DDPG、PPO、DPPO算法/67:代码实战_DPPO_GlobalPPO和Workers交替执行.mp4
迅雷云盘
视频 / 48.49 MB
2025-10-20
66:代码实战_DPPO_创建一个PPO和多个Worker_创建多线程.mp4
/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节5:DDPG、PPO、DPPO算法/66:代码实战_DPPO_创建一个PPO和多个Worker_创建多线程.mp4
迅雷云盘
视频 / 33.08 MB
2025-10-20
64:代码实战_剖析PPO代码中如何体现Off-Policy的学习方式_效果展示.mp4
/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节5:DDPG、PPO、DPPO算法/64:代码实战_剖析PPO代码中如何体现Off-Policy的学习方式_效果展示.mp4
迅雷云盘
视频 / 34.44 MB
2025-10-20
65:DPPO分布式PPO.mp4
/【百战程序员】AI算法工程师就业班-带源码课件/31、【加课】强化学习【新增】/章节5:DDPG、PPO、DPPO算法/65:DPPO分布式PPO.mp4
迅雷云盘
视频 / 36.43 MB
2025-10-20
共 16 条记录 • 第 1 页 • 共 1 页