Faster Segment Anything: Towards Lightweight SAM for Mobile Applications

11 Jul 2023

Segment Anything Model (SAM)を蒸留により軽量化するMobileSAMの提案．SAM全体を一度に蒸留するのではなく，画像エンコーダとマスクデコーダに分けて蒸留を行う（後者はオプション）．精度を維持しつつ推論時間を1/50以下にした．

基本情報

@misc{zhang2023faster,
      title={Faster Segment Anything: Towards Lightweight SAM for Mobile Applications}, 
      author={Chaoning Zhang and Dongshen Han and Yu Qiao and Jung Uk Kim and Sung-Ho Bae and Seungkyu Lee and Choong Seon Hong},
      year={2023},
      eprint={2306.14289},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

論文リンク

arXiv / GitHub

著者・所属

Chaoning Zhang, Dongshen Han, Yu Qiao, Jung Uk Kim, Sung-Ho Bae, Seungkyu Lee, Choong Seon Hong (Kyung Hee University)

新規性

オリジナルのSAMでは画像エンコーダの実行に500ms近くかかっていたところ，10ms以下に軽量化したこと．

手法


原論文Figure 3．手法の概要．画像エンコーダ部分を蒸留する．

ViT-HからなるオリジナルのSAMの画像エンコーダ部分を軽量なモデルに蒸留する．各種ハイパーパラメータについて記述はあるものの，肝心の蒸留の詳細は論文ではあまり語られていない…（コードを見ればいいのだが）

備忘録機械学習，コンピュータビジョン，時々物理

Faster Segment Anything: Towards Lightweight SAM for Mobile Applications

基本情報

論文リンク

著者・所属

新規性

手法

結果

議論・コメント

関連文献

Tags

備忘録 機械学習，コンピュータビジョン，時々物理

Faster Segment Anything: Towards Lightweight SAM for Mobile Applications

基本情報

論文リンク

著者・所属

新規性

手法

結果

議論・コメント

関連文献

Tags

Related Posts

On Convergence of Adam for Stochastic Optimization under Relaxed Assumptions 11 Feb 2024

End-to-End Temporal Action Detection with 1B Parameters Across 1000 Frames. (arXiv:2311.17241v1 [cs.CV]) 08 Feb 2024

Region-Based Representations Revisited 07 Feb 2024

備忘録機械学習，コンピュータビジョン，時々物理