Key points are not available for this paper at this time.
Uma implementação da Arquitetura de Dispositivo Unificado para Computação (CUDA) da Rede Neural Convolucional Profunda (DCNN) para um sistema de reconhecimento de dígitos é proposta para reduzir o tempo de computação de ANN e alcançar alta precisão. Uma rede neural com três camadas de convoluções e duas camadas totalmente conectadas é desenvolvida construindo neurônios de entrada, ocultos e de saída para alcançar uma precisão melhorada. A rede é paralelizada usando uma GPU dedicada na plataforma CUDA utilizando a biblioteca TensorFlow. Uma análise comparativa de precisão e tempo de computação é realizada para a execução sequencial e paralela da rede em uma CPU de núcleo duplo (4 processadores lógicos), CPU octa-core (16 processadores lógicos) somente e sistemas CPU octa-core (16 processadores lógicos) com GPU. O banco de dados MNIST (Instituto Nacional de Padrões e Tecnologia Modificado) e EMNIST (EMNIST Estendido) são usados tanto para treinamento quanto para teste. O MNIST possui 55000 conjuntos de treinamento, 10000 conjuntos de teste e 5000 conjuntos de validação. O EMNIST consiste em 235000 conjuntos de treinamento, 40000 conjuntos de teste e 5000 conjuntos de validação. A rede projetada requer alta computação e, portanto, sua paralelização mostra uma melhoria significativa no tempo de execução.
Singh et al. (Mon,) estudaram essa questão.