The Implicit Bias of Batch Normalization in Linear Models and Two-layer Linear Convolutional Neural Networks. (arXiv:2306.11680v2 [cs.LG] UPDATED)

13 Jul 2023

バッチ正規化の暗黙的バイアスについて．バッチ正規化付き線形モデルは，最大マージン解ではなく一様マージン解に収束する．一様マージンが最大マージンよりも有利である問題設定があることを議論．タイトルを見てBNは「暗黙的」ではないバイアスではないかと考えてしまったが，BNがあっても仮説空間は変わらない（線形モデルは線形モデルのまま）なのでやはり「暗黙的」なのか．

基本情報

@misc{cao2023implicit,
      title={The Implicit Bias of Batch Normalization in Linear Models and Two-layer Linear Convolutional Neural Networks}, 
      author={Yuan Cao and Difan Zou and Yuanzhi Li and Quanquan Gu},
      year={2023},
      eprint={2306.11680},
      archivePrefix={arXiv},
      primaryClass={cs.LG}
}

備忘録機械学習，コンピュータビジョン，時々物理

The Implicit Bias of Batch Normalization in Linear Models and Two-layer Linear Convolutional Neural Networks. (arXiv:2306.11680v2 [cs.LG] UPDATED)

基本情報

論文リンク

著者・所属

新規性

手法

結果

議論・コメント

関連文献

Tags

備忘録 機械学習，コンピュータビジョン，時々物理

The Implicit Bias of Batch Normalization in Linear Models and Two-layer Linear Convolutional Neural Networks. (arXiv:2306.11680v2 [cs.LG] UPDATED)

基本情報

論文リンク

著者・所属

新規性

手法

結果

議論・コメント

関連文献

Tags

Related Posts

On Convergence of Adam for Stochastic Optimization under Relaxed Assumptions 11 Feb 2024

End-to-End Temporal Action Detection with 1B Parameters Across 1000 Frames. (arXiv:2311.17241v1 [cs.CV]) 08 Feb 2024

Region-Based Representations Revisited 07 Feb 2024

備忘録機械学習，コンピュータビジョン，時々物理