Key points are not available for this paper at this time.
A detecção fora da distribuição (OOD) é crucial para aplicações de aprendizado de máquina críticas para segurança e tem sido extensivamente estudada. Embora estudos recentes tenham se concentrado predominantemente em métodos baseados em classificadores, a pesquisa sobre métodos baseados em modelos generativos profundos (DGM) tem ficado relativamente para trás. Essa disparidade pode ser atribuída a um fenômeno perplexo: os DGMs frequentemente atribuem maiores probabilidades a entradas OOD desconhecidas do que aos seus dados de treinamento conhecidos. Este artigo foca em explicar o mecanismo subjacente a esse fenômeno. Propomos uma hipótese de que imagens menos complexas se concentram em regiões de alta densidade no espaço latente, resultando em uma atribuição de probabilidade mais alta no Normalizing Flow (NF). Demonstramos experimentalmente sua validade para cinco arquiteturas de NF, concluindo que suas probabilidades não são confiáveis. Além disso, mostramos que esse problema pode ser aliviado tratando a complexidade da imagem como uma variável independente. Finalmente, fornecemos evidências da potencial aplicabilidade de nossa hipótese em outro DGM, PixelCNN++.
Osada et al. (Sun,) estudaram essa questão.