May 23, 2016Open Access

Redes Residuais Amplas

Key Points

Key points are not available for this paper at this time.

Abstract

As redes residuais profundas demonstraram ser capazes de escalar até milhares de camadas e ainda assim ter um desempenho em melhoria. No entanto, cada fração de um por cento de precisão melhorada custa quase o dobro do número de camadas, e assim, o treinamento de redes residuais muito profundas tem o problema da reutilização reduzida de características, o que torna essas redes muito lentas para treinar. Para enfrentar esses problemas, neste artigo realizamos um estudo experimental detalhado sobre a arquitetura dos blocos ResNet, com base no qual propomos uma nova arquitetura onde diminuímos a profundidade e aumentamos a largura das redes residuais. Chamamos as estruturas de rede resultantes de redes residuais amplas (WRNs) e mostramos que estas são muito superiores em relação às suas contrapartes finas e muito profundas comumente utilizadas. Por exemplo, demonstramos que mesmo uma simples rede residual ampla de 16 camadas supera em precisão e eficiência todas as redes residuais profundas anteriores, incluindo redes de mil camadas, alcançando novos resultados de ponta no CIFAR, SVHN, COCO e melhorias significativas no ImageNet. Nosso código e modelos estão disponíveis em https://github.com/szagoruyko/wide-residual-networks

Perguntar à IA

Bookmark

View Full Paper