Na era recente, o crescimento do aprendizado profundo é inevitável. Vários modelos, como redes neurais convolucionais (CNNs) e transformadores, são amplamente utilizados em imagens para alta precisão de classificação. Desde a invenção dos transformadores, os pesquisadores têm usado amplamente abordagens inovadoras utilizando transformadores para alcançar uma precisão impressionante. Apesar disso, este artigo propõe um novo modelo de CNN leve e personalizado chamado Rede Atenta e Leve (ALNet). O ALNet consiste em três blocos principais: base, núcleo e cabeça. A parte central é o classificador inovador construído com inspiração em vários modelos pré-treinados, como ResNet, SENet (Rede de Compressão e Excitação), EfficientNet, SqueezeNet e ShuffleNet. O principal objetivo é construir um modelo que tenha uma alta precisão de classificação enquanto reduz o número de parâmetros. Isso reduz o tamanho do modelo e, consequentemente, facilita sua implantação em plataformas de nuvem e uso em dispositivos de borda. O modelo foi avaliado usando validação cruzada de 5 dobras em três conjuntos de dados diferentes. O conjunto de dados primário era um conjunto de dados de videira com uma precisão de 99,78% e 100% na classificação multi-classe e binária, respectivamente. Para testar a robustez do modelo, uma classificação multi-classe usando o conjunto de dados de maçã alcançou uma precisão de 99,95% e uma classificação binária com o conjunto de dados de cereja alcançou uma precisão de 100%. O ALNet usa apenas 0,17 milhão de parâmetros, que é 18 vezes menos parâmetros do que o modelo mais leve (SqueezeNet), e leva apenas 14 segundos para treinar cada época, enquanto modelos pré-treinados levam de 17 a 31 segundos. O ALNet requer apenas 151,98 MFLOPs com um tamanho de modelo de 677,20 KB, tornando-o aproximadamente 18 vezes menor que o SqueezeNet. No geral, o ALNet é um modelo leve e altamente preciso para a previsão de doenças em folhas de plantas.
Dennisan et al. (Mon,) estudaram esta questão.