Key points are not available for this paper at this time.
O componente central da maioria dos rastreadores modernos é um classificador discriminativo, encarregado de distinguir entre o alvo e o ambiente ao redor. Para lidar com as mudanças naturais nas imagens, este classificador é tipicamente treinado com amostras traduzidas e redimensionadas. Esses conjuntos de amostras estão repletos de redundâncias - quaisquer pixels sobrepostos são restringidos a ser os mesmos. Com base nesta simples observação, propomos um modelo analítico para conjuntos de dados de milhares de patches traduzidos. Ao mostrar que a matriz de dados resultante é circulante, podemos diagonalizá-la com a Transformada de Fourier discreta, reduzindo tanto o armazenamento quanto a computação em várias ordens de magnitude. Curiosamente, para regressão linear, nossa formulação é equivalente a um filtro de correlação, usado por alguns dos rastreadores competitivos mais rápidos. No entanto, para regressão por kernel, derivamos um novo filtro de correlação kernelizado (KCF), que, ao contrário de outros algoritmos de kernel, possui a mesma complexidade que seu contrapartida linear. Com base nisso, também propomos uma extensão multi-canal rápida de filtros de correlação linear, por meio de um kernel linear, que chamamos de filtro de correlação dual (DCF). Tanto o KCF quanto o DCF superam os rastreadores de mais alto ranking, como Struck ou TLD, em um benchmark de 50 vídeos, apesar de funcionarem a centenas de quadros por segundo e serem implementados em poucas linhas de código (Algoritmo 1). Para incentivar novos desenvolvimentos, nossa estrutura de rastreamento foi tornada open-source.
Henriques et al. (Fri,) estudaram essa questão.