October 1, 2019

GCNet: Las Redes No Locales se Encuentran con las Redes de Compresión-Excitación y Más Allá

Puntos clave

Los puntos clave no están disponibles para este artículo en este momento.

Resumen

La Red No Local (NLNet) presenta un enfoque pionero para capturar dependencias de largo alcance, mediante la agregación de contexto global específico de la consulta a cada posición de consulta. Sin embargo, a través de un análisis empírico riguroso, hemos encontrado que los contextos globales modelados por la red no local son casi los mismos para diferentes posiciones de consulta dentro de una imagen. En este documento, aprovechamos este hallazgo para crear una red simplificada basada en una formulación independiente de consulta, que mantiene la precisión de NLNet pero con significativamente menos cálculo. También observamos que este diseño simplificado comparte una estructura similar con la Red de Compresión-Excitación (SENet). Por lo tanto, las unificamos en un marco general de tres pasos para la modelación de contexto global. Dentro de este marco general, diseñamos una mejor instancia, llamada bloque de contexto global (GC), que es ligera y puede modelar eficazmente el contexto global. La propiedad ligera nos permite aplicarlo a múltiples capas en una red de respaldo para construir una red de contexto global (GCNet), que en general supera tanto a la NLNet simplificada como a la SENet en los principales puntos de referencia para varias tareas de reconocimiento.

Preguntar a la IA

Me gusta

Guardar