Steam Community :: Advanced Micro Devices

STEAM

Advanced Micro Devices

农企AMD

Chongqing, Chongqing, China

Steam Awards Nomination Committee 2017

超威半导体官方账号

View more info

Currently Offline

5 Members

A岛/MU/小海豹组

37 Members

115

Raty
Offline

108

БeБ
Offline

87

黑白院清罗
Offline

71

Luanru.Joestar
Offline

53

ObscurMarasy
Offline

52

鸭duck
Offline

Achievement Showcase

233

Achievements

Avg. Game Completion Rate

Recent Activity

2.6 hrs on record
last played on 9 Feb

Sid Meier's Civilization VI

Achievement Progress 0 of 320

21 hrs on record
last played on 12 Jan

Europa Universalis IV

Achievement Progress 0 of 373

0.6 hrs on record
last played on 12 Jan

Goose Goose Duck

Achievement Progress 1 of 38

View All Recently Played | Wishlist | Reviews

Comments

View all 23 comments

< >

kk 15 Mar, 2024 @ 5:52pm

从DDPG这个名字看，它是由D（Deep）+D（Deterministic ）+ PG(Policy Gradient)组成。PG(Policy Gradient)我们在强化学习(十三) 策略梯度(Policy Gradient)里已经讨论过。那什么是确定性策略梯度(Deterministic Policy Gradient，以下简称DPG)呢？

　　　　确定性策略是和随机策略相对而言的，对于某一些动作集合来说，它可能是连续值，或者非常高维的离散值，这样动作的空间维度极大。如果我们使用随机策略，即像DQN一样研究它所有的可能动作的概率，并计算各个可能的动作的价值的话，那需要的样本量是非常大才可行的。于是有人就想出使用确定性策略来简化这个问题。

kk 18 Sep, 2021 @ 8:14pm

你有毒啊啊啊啊啊啊

kk 8 Mar, 2021 @ 8:47pm

您儿子在我店赊账累计1583元，请即刻付款，谢谢！

kk 25 Feb, 2021 @ 12:05pm

我们注意到您已经近2周没有登入PornHub了，请允许我们问候一声您是否一切如常。从您上次访问我们以后，我们已经更新了很多您喜欢的男同性恋片。
希望能很快再见到你。 - ♥♥♥♥♥♥♥™ 管理员

Makima 11 Jan, 2021 @ 1:15pm

You Are An Idiot

kk 14 Sep, 2018 @ 3:38am

早生贵子

< >