Key points are not available for this paper at this time.
Modelos recentes para compressão de imagem aprendida são baseados em autoencoders, mapeamentos aproximadamente invertíveis de pixels para um latente quantizado. Estes são combinados com um modelo de entropia, um prior sobre o latente que pode ser usado com algoritmos de codificação aritmética padrão para um fluxo de bits comprimido. Recentemente, modelos hierárquicos de entropia têm sido explorados como uma forma de aproveitar mais estrutura nos latentes do que priors simples totalmente, melhorando o desempenho da compressão enquanto mantém a otimização de ponta a ponta. Inspirados pelo sucesso de priors autoregressivos em modelos generativos, examinamos priors autoregressivos, hierárquicos e como priors combinados como alternativas, avaliando seus custos e benefícios no contexto da compressão de imagens. Embora seja bem conhecido que os priors autoregressivos vêm com uma penalidade computacional significativa, encontramos que em termos de desempenho, os priors autoregressivos e hierárquicos são e, juntos, exploram a estrutura probabilística nos latentes mais do que todos os modelos aprendidos anteriores. O modelo combinado produz desempenho de taxa-distorsão de ponta, proporcionando uma média de 15,8% em tamanho de arquivo em relação ao método de ponta anterior baseado em profundo, o que corresponde a uma redução de tamanho de 59,8% em relação ao JPEG, mais de 35% em comparação ao WebP e JPEG2000, e fluxos de bits 8,4% menores do que o BPG, o codec de imagem de ponta atual. Ao melhor de nosso conhecimento, nosso método é o primeiro baseado em aprendizado a superar o BPG em ambas as métricas de distorção PSNR e SSIM.
Minnen et al. (Fri,) estudaram esta questão.