Key points are not available for this paper at this time.
Um grande número de novas codificações para modelos de bolsa de palavras visuais foi proposto nos últimos dois anos para melhorar o histograma padrão de características locais quantizadas. Exemplos incluem codificação linear com restrição de localidade 23, codificação Fisher melhorada 17, codificação de super vetor 27, e codificação de livro de códigos de kernel 20. Embora vários autores tenham relatado resultados muito bons nos desafiadores dados de classificação do PASCAL VOC por meio dessas novas técnicas, as diferenças na computação de características e nos algoritmos de aprendizagem, detalhes ausentes na descrição dos métodos, e o ajuste diferente dos vários componentes, tornam impossível comparar diretamente esses métodos e difícil reproduzir os resultados relatados. Este artigo aborda essas deficiências realizando uma avaliação rigorosa dessas novas técnicas ao: (1) fixar os outros elementos do pipeline (características, aprendizagem, ajuste); (2) divulgar todos os detalhes da implementação, e (3) identificar tanto os aspectos de cada método que são particularmente importantes para alcançar um bom desempenho, quanto aqueles que são menos críticos. Isso permite uma análise comparativa consistente desses métodos de codificação. Várias conclusões tiradas de nossa análise não podem ser inferidas das publicações originais.
Chatfield et al. (Sat,) estudaram essa questão.