Los puntos clave no están disponibles para este artículo en este momento.
Se presenta un algoritmo de aprendizaje no supervisado para la separación de fuentes sonoras en señales musicales de un solo canal. El algoritmo se basa en factorizar el espectrograma de magnitud de una señal de entrada en una suma de componentes, cada uno de los cuales tiene un espectro de magnitud fijo y una ganancia variable en el tiempo. Cada fuente sonora, a su vez, se modela como una suma de uno o más componentes. Los parámetros de los componentes se estiman minimizando el error de reconstrucción entre el espectrograma de entrada y el modelo, mientras se restringen los espectrogramas de los componentes a ser no negativos y se favorecen los componentes cuyas ganancias varían lentamente y son escasas. La continuidad temporal se favorece utilizando un término de costo que es la suma de las diferencias al cuadrado entre las ganancias en cuadros adyacentes, y la dispersión se favorece penalizando ganancias no nulas. El algoritmo de estimación iterativa propuesto se inicializa con valores aleatorios, y las ganancias y los espectros se actualizan alternativamente utilizando reglas de actualización multiplicativa hasta que los valores converjan. Se realizaron experimentos de simulación utilizando mezclas generadas de muestras de instrumentos musicales afinados y sonidos de percusión. Se comparó el rendimiento del método propuesto con el análisis de subespacio independiente y la factorización de matrices no negativas básica, que se basan en el mismo modelo lineal. De acuerdo con estas simulaciones, el método propuesto permite una mejor calidad de separación que los algoritmos anteriores. Especialmente, el criterio de continuidad temporal mejoró la detección de sonidos musicales afinados. El criterio de dispersión no produjo mejoras significativas.
Tuomas Virtanen (Jue,) estudió esta cuestión.
Synapse has enriched 3 closely related papers on similar clinical questions. Consider them for comparative context: