Key points are not available for this paper at this time.
Bien que les informations locales et contextuelles soient cruciales pour un suivi robuste, les méthodes basées sur CNN et transformateurs existantes se concentrent principalement sur l'un de ces aspects. Par conséquent, les premières échouent à exploiter les riches informations contextuelles globales en raison d'un champ réceptif limité, tandis que les dernières souffrent des déficiences dans la construction de la relation locale entre les régions voisines. Pour remédier à ce problème, nous proposons le tracker SiamPIN, basé sur notre Réseau d'Interaction Parallèle. Il se compose de deux modules efficaces, à savoir le Bloc d'Agrégation Global (GAB) et le Bloc de Processus Local (LPB). Le GAB perçoit le contexte global pour capturer la dépendance spatiale à longue portée à travers une architecture basée sur un transformateur. Pendant ce temps, le LPB réalise l'extraction d'informations locales à l'aide d'un modèle CNN pour conserver les informations d'apparence détaillées de la cible. Ces deux modules sont connectés successivement pour composer un bloc d'unité Trans-Conv, qui transmet les informations de contexte global à la procédure d'extraction de caractéristiques locales, permettant ainsi l'interaction du flux d'informations globales et locales. Plusieurs de ces blocs sont en cascade afin que notre modèle puisse apprendre à agréger de manière interactive les informations locales et contextuelles. Le tracker proposé atteint une performance de pointe sur six ensembles de données de référence, tout en maintenant une vitesse d'exécution en temps réel.
Zheng et al. (Mon,) ont étudié cette question.
Synapse has enriched 4 closely related papers on similar clinical questions. Consider them for comparative context: