Key points are not available for this paper at this time.
Neste artigo, apresentamos madmom, uma biblioteca de processamento de áudio e recuperação de informações musicais (MIR) de código aberto escrita em Python. madmom possui um design conciso, compatível com NumPy, orientado a objetos, com convenções de chamada simples e valores padrão sensíveis para todos os parâmetros, o que facilita o protótipo rápido de aplicações de MIR. Prototótipos podem ser facilmente convertidos em pipelines de processamento chamáveis através do conceito de Processadores do madmom, objetos chamáveis que rodam de forma transparente em múltiplos núcleos. Os Processadores também podem ser serializados, salvos e re-executados para permitir que os resultados sejam facilmente reproduzidos em qualquer lugar. Além do processamento de áudio de baixo nível, madmom enfatiza características de alto nível musicalmente significativas. Muitas destas incorporam técnicas de aprendizado de máquina e madmom fornece um módulo que implementa alguns métodos comumente usados em MIR, como modelos ocultos de Markov e redes neurais. Adicionalmente, madmom vem com vários algoritmos de MIR de ponta para detecção de início, rastreamento de batidas, batida descendente e métrica, estimativa de tempo e reconhecimento de acordes. Estes podem ser facilmente incorporados em sistemas de MIR maiores ou executados como programas autônomos.
Böck et al. (Thu,) estudaram esta questão.