Key points are not available for this paper at this time.
As redes residuais profundas demonstraram ser capazes de escalar até milhares de camadas e ainda assim ter um desempenho em melhoria. No entanto, cada fração de um por cento de precisão melhorada custa quase o dobro do número de camadas, e assim, o treinamento de redes residuais muito profundas tem o problema da reutilização reduzida de características, o que torna essas redes muito lentas para treinar. Para enfrentar esses problemas, neste artigo realizamos um estudo experimental detalhado sobre a arquitetura dos blocos ResNet, com base no qual propomos uma nova arquitetura onde diminuímos a profundidade e aumentamos a largura das redes residuais. Chamamos as estruturas de rede resultantes de redes residuais amplas (WRNs) e mostramos que estas são muito superiores em relação às suas contrapartes finas e muito profundas comumente utilizadas. Por exemplo, demonstramos que mesmo uma simples rede residual ampla de 16 camadas supera em precisão e eficiência todas as redes residuais profundas anteriores, incluindo redes de mil camadas, alcançando novos resultados de ponta no CIFAR, SVHN, COCO e melhorias significativas no ImageNet. Nosso código e modelos estão disponíveis em https://github.com/szagoruyko/wide-residual-networks
Zagoruyko et al. (Mon,) estudaram esta questão.