精密なビデオセグメンテーションのための現在の研究ワークフローは、労力を要する手動キュレーション、高価な商用プラットフォーム、およびプライバシーを損なうクラウドベースのサービスの間で妥協を強いられることが多いです。研究における高忠実度のビデオインスタンスセグメンテーションの需要は、手動アノテーションのボトルネックとクラウドベースツールのプライバシー問題によって妨げられています。私たちはSAMannotを提案します。これはオープンソースでローカルに動作するフレームワークであり、Segment Anything Model 2(SAM2)をヒューマンインザループワークフローに統合したものです。基盤モデルの高いリソース要件に対処するため、SAM2の依存関係を修正し、計算オーバーヘッドを最小限に抑えスループットを最大化する処理層を実装し、高度に応答性の高いユーザーインターフェースを保証しました。主な機能には永続的なインスタンス識別管理、バリアフレームを用いた自動“ロック・アンド・リファイン”ワークフロー、およびマスク骨格化に基づく自動プロンプティングメカニズムが含まれます。SAMannotは構造化されたインタラクションログと共に、YOLOおよびPNG形式の研究準備済みデータセットの生成を促進します。動物行動追跡のユースケースやLVOSおよびDAVISのベンチマークデータセットのサブセットによって検証されており、このツールは複雑なビデオ注釈タスクに対する商用プラットフォームの拡張可能でプライベートかつ費用効果の高い代替手段を提供します。
Dinya et al. (Thu、)はこの問題を研究しました。
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: