自适应实时评估算法(Adam [Adaptive Moment Estimation]),相当于RMSprop 和 Momentum 结合的一种算法,标准Adam 可以认为是 一阶AdaDelta 的动量改进版。
迭代公式:
其中 m^t\hat{m}_tm^t 、 v^t\hat{v}_tv^t 是我们为了防止 mmm 、 vvv 被初始化时为 000 导致向 000 偏移而做的 偏差校正值,有:
取 经验系数 β1\beta_1β1 、 β1\beta_1β1 ,Hinton建议 β1=0.9\beta_1 = 0.9β1=0.9 ,β2=0.999\beta_2 = 0.999β2=0.999 取 η\etaη 防爆因子,建议 ϵ=10e-8\epsilon = \text{10e-8}ϵ=10e-8 避免干扰运算
Adam 很好的结合了前辈们的各种优化处理手段,成为了集大成之优化函数。因此,Adam是被经常使用的,现代主流优化函数之一。
Last updated 1 year ago