You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
强化学习的最普遍的结构 Actor Critic,可以参考A3C的原论文以及OpenAI的Baselines里的实现。
这里的subnet是Actor网络和Critic网络共享的部分,输入通过subnet后再分别输入Actor和Critc,意思是subnet对输入抽象之后再分别用来算Action和Value。当然对于这种简单的问题,直接A和C两个网络也完全没问题。
您好 请问一下您是否还能讲述一下您在构建agent.py中的3个神经网络:subnet actornet 以及criticnet网络的构建方法,我使用的时候对于3个网络的构建不是特别清楚,其次是您在定义环境的时候那个place_lane是代表什么意思
The text was updated successfully, but these errors were encountered: