Key points are not available for this paper at this time.
O reconhecimento detalhado de carros visa reconhecer as informações da categoria de um carro, como marca, modelo ou até mesmo o ano de fabricação. Vários estudos recentes mostraram que uma rede neural convolucional profunda (DCNN) treinada em um conjunto de dados em larga escala pode alcançar resultados impressionantes em uma variedade de tarefas de classificação de objetos genéricos. Neste artigo, propomos uma estratégia de pooling ponderado espacialmente (SWP), que melhora consideravelmente a robustez e a eficácia da representação das características da maioria das DCNNs dominantes. Mais especificamente, o SWP é uma nova camada de pooling, que contém um número predefinido de máscaras ou canais de pooling ponderados espacialmente. O SWP realiza o pooling das características extraídas das DCNNs com a orientação de suas máscaras aprendidas, que medem a importância das unidades espaciais em termos de poder discriminativo. Assim como os métodos existentes que aplicam pooling em grade uniforme nos mapas de características convolucionais das DCNNs, o método proposto pode extrair as características convolucionais e gerar os canais de pooling a partir de uma única DCNN. Portanto, são necessárias modificações mínimas em termos de implementação. Além disso, os parâmetros da camada SWP podem ser aprendidos no processo de treinamento de ponta a ponta da DCNN. Ao aplicar nosso método a vários conjuntos de dados de reconhecimento detalhado de carros, demonstramos que o método proposto pode alcançar um desempenho melhor do que abordagens recentes na literatura. Avançamos os resultados de última geração ao melhorar a precisão de 92,6% para 93,1% no conjunto de dados Stanford Cars-196 e de 91,2% para 97,6% no recente conjunto de dados CompCars. Também testamos o método proposto em dois conjuntos de dados adicionais em larga escala, com resultados impressionantes observados.
Hu et al. (Ter,) estudaram esta questão.