Implicit regularization in Heavy-ball momentum accelerated stochastic gradient descent

27 Jun 2023

モメンタム(S)GDは学習率が小さい場合に，元の損失関数とは異なる修正損失関数の勾配流で近似できることを理論的に証明した．修正損失関数と元の損失関数の差は暗黙的正則化と捉えられるが，これがモメンタム無しの(S)GDよりも大きいことからモメンタムには暗黙的正則化を強める働きがある．

基本情報

@inproceedings{
ghosh2023implicit,
title={Implicit regularization in Heavy-ball momentum accelerated stochastic gradient descent},
author={Avrajit Ghosh and He Lyu and Xitong Zhang and Rongrong Wang},
booktitle={The Eleventh International Conference on Learning Representations },
year={2023},
url={https://openreview.net/forum?id=ZzdBhtEH9yB}
}

論文リンク

OpenReview

著者・所属

Avrajit Ghosh, He Lyu, Xitong Zhang, Rongrong Wang (Michigan State University)

新規性

モメンタム(S)GDに対応する修正損失関数を導出し，このアルゴリズムの暗黙的正則化を明らかにした．

備忘録機械学習，コンピュータビジョン，時々物理

Implicit regularization in Heavy-ball momentum accelerated stochastic gradient descent

基本情報

論文リンク

著者・所属

新規性

手法

結果

議論・コメント

関連文献

Tags

備忘録 機械学習，コンピュータビジョン，時々物理

Implicit regularization in Heavy-ball momentum accelerated stochastic gradient descent

基本情報

論文リンク

著者・所属

新規性

手法

結果

議論・コメント

関連文献

Tags

Related Posts

On Convergence of Adam for Stochastic Optimization under Relaxed Assumptions 11 Feb 2024

End-to-End Temporal Action Detection with 1B Parameters Across 1000 Frames. (arXiv:2311.17241v1 [cs.CV]) 08 Feb 2024

Region-Based Representations Revisited 07 Feb 2024

備忘録機械学習，コンピュータビジョン，時々物理