DiffTAD: Temporal Action Detection with Proposal Denoising Diffusion. (arXiv:2303.14863v2 [cs.CV] UPDATED)

19 Jul 2023

時間的行動検知を拡散モデルで解いた論文（ICCV2023）．時間的行動検知を動画エンコーダが出力する特徴量で条件づけられた生成タスクとみなす．ノイズの乗った行動区間候補をデノイズ（逆拡散）して行動区間を予測する，という形で拡散モデルの定式化に乗せる．ActivityNetとTHUMOSによる評価で従来法を上回る．

基本情報

@misc{nag2023difftad,
      title={DiffTAD: Temporal Action Detection with Proposal Denoising Diffusion}, 
      author={Sauradip Nag and Xiatian Zhu and Jiankang Deng and Yi-Zhe Song and Tao Xiang},
      year={2023},
      eprint={2303.14863},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

備忘録機械学習，コンピュータビジョン，時々物理

DiffTAD: Temporal Action Detection with Proposal Denoising Diffusion. (arXiv:2303.14863v2 [cs.CV] UPDATED)

基本情報

論文リンク

著者・所属

新規性

手法

結果

議論・コメント

関連文献

Tags

備忘録 機械学習，コンピュータビジョン，時々物理

DiffTAD: Temporal Action Detection with Proposal Denoising Diffusion. (arXiv:2303.14863v2 [cs.CV] UPDATED)

基本情報

論文リンク

著者・所属

新規性

手法

結果

議論・コメント

関連文献

Tags

Related Posts

On Convergence of Adam for Stochastic Optimization under Relaxed Assumptions 11 Feb 2024

End-to-End Temporal Action Detection with 1B Parameters Across 1000 Frames. (arXiv:2311.17241v1 [cs.CV]) 08 Feb 2024

Region-Based Representations Revisited 07 Feb 2024

備忘録機械学習，コンピュータビジョン，時々物理