Learning to Detect and Segment for Open Vocabulary Object Detection

19 Jun 2023

語彙を制限しない物体検知の研究．先行研究ではボックス/マスクの推定に物体クラスに依存しないモデルを用いたのに対し，この回帰にも意味情報を活用するためのヘッド CondHead を提案．ヘッドのパラメータを意味埋め込みから動的に決定する．従来法のヘッドに採用することで物体検知と実体領域分割の精度を向上．

基本情報

@InProceedings{Wang_2023_CVPR,
    author    = {Wang, Tao},
    title     = {Learning To Detect and Segment for Open Vocabulary Object Detection},
    booktitle = {Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)},
    month     = {June},
    year      = {2023},
    pages     = {7051-7060}
}

論文リンク

CVPR / arXiv

著者・所属

Tao Wang, Nan Li (NUS, UCSD)

新規性

意味情報の埋め込みから回帰器のパラメータを動的に生成するCondHeadにより，カテゴリーの意味情報を使ってボックスやマスクの回帰精度を上げることができると明らかにした点（従来のopen-vocab物体検知では，分類に画像・テキスト学習で獲得した意味情報を用いるものの回帰はクラス非依存に実行していた）．

備忘録機械学習，コンピュータビジョン，時々物理

Learning to Detect and Segment for Open Vocabulary Object Detection

基本情報

論文リンク

著者・所属

新規性

手法

結果

議論・コメント

関連文献

Tags

備忘録 機械学習，コンピュータビジョン，時々物理

Learning to Detect and Segment for Open Vocabulary Object Detection

基本情報

論文リンク

著者・所属

新規性

手法

結果

議論・コメント

関連文献

Tags

Related Posts

On Convergence of Adam for Stochastic Optimization under Relaxed Assumptions 11 Feb 2024

End-to-End Temporal Action Detection with 1B Parameters Across 1000 Frames. (arXiv:2311.17241v1 [cs.CV]) 08 Feb 2024

Region-Based Representations Revisited 07 Feb 2024

備忘録機械学習，コンピュータビジョン，時々物理