A rede DeepLabv3 +, amplamente utilizada para segmentação semântica, sofre com problemas como excesso de parâmetros, segmentação imprecisa de alvos de borda e dificuldade de implantação em dispositivos móveis. Este artigo propõe um algoritmo de segmentação semântica leve e melhorado, MFA-DeepLabv3+, baseado no DeepLabv3+. O MFA-DeepLabv3 + proposto utiliza MobileNetV2 como rede de backbone para reduzir os parâmetros do modelo e os custos computacionais. Uma estrutura de fusão de múltiplas características (MFF) é projetada para expandir o campo receptivo, ao mesmo tempo em que otimiza as taxas atrous no módulo Atrous Spatial Pyramid Pooling (ASPP) para melhorar a extração de informações espaciais e mitigar a perda crítica de informações. Além disso, um módulo de Atenção em Pirâmide Global (GPA) é introduzido para melhorar a captura de características contextuais, permitindo que a rede se concentre em regiões-chave da imagem através de filtragem adaptativa de informações. Resultados experimentais demonstram que no conjunto de dados PASCAL VOC 2012ₐug, o modelo alcança melhorias de 1,64% em mIoU e 1,21% em FWIoU. No conjunto de dados Cityscapes, obtém ganhos de 2,75% em mIoU e 1,42% em FWIoU, reduzindo o número de parâmetros em 83%.
Liu et al. (Tue,) estudaram esta questão.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: