Los puntos clave no están disponibles para este artículo en este momento.
Las redes neuronales convolucionales (CNNs) son poderosas herramientas de aprendizaje automático que han demostrado ser eficientes en el campo del procesamiento de imágenes y el reconocimiento de sonidos. En este artículo, se presenta y prueba un sistema de CNN que clasifica sonidos de aves a través de diferentes configuraciones y hiperparámetros. El modelo de CNN MobileNet preentrenado es ajustado utilizando un conjunto de datos adquirido del portal de compartición de canciones de aves Xeno-canto, que proporciona una gran colección de grabaciones etiquetadas y categorizadas. Los espectrogramas generados a partir de los datos descargados representan la entrada de la red neuronal. Los experimentos adjuntos comparan varias configuraciones, incluyendo el número de clases (especies de aves) y el esquema de color de los espectrogramas. Los resultados sugieren que elegir un mapa de colores en línea con las imágenes con las que la red ha sido preentrenada proporciona una ventaja medible. El sistema presentado es viable solo para un bajo número de clases.
Incze et al. (Sat,) estudiaron esta cuestión.