希
Followers: 0 Following: 0
Statistiques
1 Question
0 Réponses
RANG
240 189
of 295 527
RÉPUTATION
0
CONTRIBUTIONS
1 Question
0 Réponses
ACCEPTATION DE VOS RÉPONSES
0.0%
VOTES REÇUS
0
RANG
of 20 242
RÉPUTATION
N/A
CLASSEMENT MOYEN
0.00
CONTRIBUTIONS
0 Fichier
TÉLÉCHARGEMENTS
0
ALL TIME TÉLÉCHARGEMENTS
0
RANG
of 154 057
CONTRIBUTIONS
0 Problèmes
0 Solutions
SCORE
0
NOMBRE DE BADGES
0
CONTRIBUTIONS
0 Publications
CONTRIBUTIONS
0 Public Chaîne
CLASSEMENT MOYEN
CONTRIBUTIONS
0 Point fort
NOMBRE MOYEN DE LIKES
Feeds
Question
我再使用强化学习工具箱编写SAC智能体进行训练时策略一直在上下限波动,没有很好的探索,而使用DDPG智能体和PPO智能体则是能够进行一些有效的探索,请问这是什么原因?
%main % 观测空间和动作空间定义 % numObs = 11; %观测空间维度 % numAct = 4;%动作空间维度 numObs1 = 7; %观测空间维度 numAct1 = 3;%动作空间维度 %BS, EB, ,CL a...
3 mois il y a | 1 réponse | 0