備忘録 機械学習,コンピュータビジョン,時々物理

Trajectory Alignment: Understanding the Edge of Stability Phenomenon via Bifurcation Theory. (arXiv:2307.04204v1 [cs.LG])

最適化ダイナミクスにおけるedge of stability現象の理論解析.著者らが正準再パラメータ化と呼ぶ「良い」座標で見ると,EoS領域での最適化の軌跡が力学系における分岐図に沿って動くtrajectory alignmentを示した.

基本情報

@misc{song2023trajectory,
      title={Trajectory Alignment: Understanding the Edge of Stability Phenomenon via Bifurcation Theory}, 
      author={Minhak Song and Chulhee Yun},
      year={2023},
      eprint={2307.04204},
      archivePrefix={arXiv},
      primaryClass={cs.LG}
}

論文リンク

arXiv

著者・所属

  • Minhak Song, Chulhee Yun (KAIST)

新規性

  • 正準再パラメータ化の導入
    • EoS領域での運動を見るのに適した座標
  • 2層線形全結合NN,学習データが1点で損失関数がリプシッツ性などの条件を満たすときにtrajectory alignmentが起こることを理論的に証明
  • 単一ニューロンの2層線形NN,学習データが1点で損失関数が2乗誤差の時にtrajectory alignmentが起こることを理論的に証明

手法

結果

議論・コメント

  • データ点が複数ある時には,ここで導入されたcanonical reparameterizationが良い座標ではなさそう

関連文献

Tags

implicit regularization, deep learning dynamics, edge of stability