Statistiques
1 Question
                        0 Réponses
RANG
293 706
                          
                          
of 300 381
                        
RÉPUTATION
0
                           
                        
CONTRIBUTIONS
                          1 Question
                          0 Réponses
ACCEPTATION DE VOS RÉPONSES 
                            0.0%
                        
VOTES REÇUS
0
RANG
 of 20 941
RÉPUTATION
N/A
CLASSEMENT MOYEN
0.00
CONTRIBUTIONS
0 Fichier
TÉLÉCHARGEMENTS 
0
ALL TIME TÉLÉCHARGEMENTS
0
RANG
of 168 477
CONTRIBUTIONS
                            0 Problèmes
                            0 Solutions
SCORE
0
NOMBRE DE BADGES
0
CONTRIBUTIONS
0 Publications
CONTRIBUTIONS
0 Public Chaîne
CLASSEMENT MOYEN
CONTRIBUTIONS
0 Point fort
NOMBRE MOYEN DE LIKES
Feeds
Question
我再使用强化学习工具箱编写SAC智能体进行训练时策略一直在上下限波动,没有很好的探索,而使用DDPG智能体和PPO智能体则是能够进行一些有效的探索,请问这是什么原因?
%main % 观测空间和动作空间定义 % numObs = 11; %观测空间维度 % numAct = 4;%动作空间维度 numObs1 = 7; %观测空间维度 numAct1 = 3;%动作空间维度 %BS, EB, ,CL a...
environ un an il y a | 1 réponse | 0