本文共 348 字,大约阅读时间需要 1 分钟。
论文信息
题目:Regularized Parameter Uncertainty for Improving Generalization in Reinforcement Learning
基于正则化参数不确定性的强化学习泛化能力提升
作者:Pehuen Moure, Longbiao Cheng, Joachim Ott, Zuowen Wang, Shih-Chii Liu
论文创新点
- 引入信噪比(SNR)作为参数不确定性的度量:论文提出了一种新的正则化方法,通过引入信噪比(SNR)来度量网络参数的不确定性。
- 提出最大SNR正则化方法:作者提出了一种最大SNR正则化方法,通过引入SNR损失项来优化网络的泛化能力。
转载地址:http://atrfk.baihongyu.com/