Key points are not available for this paper at this time.
A pesquisa em várias áreas está atualmente enfrentando desafios em relação à reprodutibilidade dos resultados. Este problema também é prevalente na pesquisa em aprendizado de máquina (ML). A questão surge principalmente devido a dados e/ou código-fonte não publicados e à sensibilidade das condições de treinamento em ML. Embora diferentes soluções tenham sido propostas para abordar esse problema, como o uso de plataformas de ML, o nível de reprodutibilidade na pesquisa impulsionada por ML continua insatisfatório. Portanto, neste artigo, discutimos a reprodutibilidade da pesquisa impulsionada por ML com três objetivos principais: (i) identificar as barreiras à reprodutibilidade ao aplicar ML na pesquisa, bem como categorizar as barreiras em diferentes tipos de reprodutibilidade (descrição, código, dados e reprodutibilidade de experimentos), (ii) identificar potenciais impulsores, como ferramentas, práticas e intervenções que apoiam a reprodutibilidade em ML, além de distinguir entre impulsores tecnológicos, impulsores processuais e impulsores relacionados à conscientização e educação, e (iii) mapear os impulsores para as barreiras. Com este trabalho, esperamos fornecer insights e contribuir para o processo de tomada de decisão sobre a adoção de diferentes soluções para apoiar a reprodutibilidade em ML.
Semmelrock et al. (qui,) estudaram essa questão.