November 15, 2023

Mejora de imágenes subacuáticas impulsada por percepción sin supervisión emparejada

Puntos clave

Los puntos clave no están disponibles para este artículo en este momento.

Resumen

La mejora de imágenes subacuáticas (UIE) tiene como objetivo mejorar la calidad visual de las imágenes subacuáticas en bruto. Los algoritmos actuales de UIE entrenan principalmente una red neuronal profunda (DNN) en conjuntos de datos sintéticos o conjuntos de datos con etiquetas pseudo mediante la minimización de la pérdida de reconstrucción entre las imágenes mejoradas y las imágenes de verdad terrestre. Sin embargo, existe una brecha entre las imágenes subacuáticas sintéticas y las del mundo real, y la pérdida ₁ o ₂, ampliamente utilizada, tiende a pasar por alto la importancia de la percepción humana, lo que resulta en una calidad perceptiva insatisfactoria de los resultados mejorados finales. En este documento, proponemos una DNN impulsada por percepción no supervisada llamada PDD-Net para UIE generalizable. En lugar de depender de imágenes emparejadas para el entrenamiento, recurrimos a una red generativa adversarial (GAN) no supervisada con un conjunto a gran escala de imágenes naturales fácilmente disponibles como dominio objetivo. Esto permite entrenar en conjuntos de imágenes más grandes recopilados de varios dominios mientras se evita el sobreajuste a cualquier protocolo de generación de datos específico. Además, para que la calidad visual de las imágenes subacuáticas mejoradas esté más alineada con la percepción humana, preentrenamos un modelo de clasificación de calidad pareada (PQR) basado en DNN, sobre la cual se formula una pérdida PQR que guía progresivamente la mejora de la imagen subacuática en bruto hacia una dirección de mayor calidad. Adicionalmente, introducimos un módulo de atención global (GAM) que integra mecanismos de modulación y atención para capturar información global y local rica, lo que lleva a mejoras tanto en brillo como en contraste. Experimentos extensivos demuestran que nuestro PDD-Net propuesto exhibe excelentes capacidades de generalización y supera métodos existentes en términos de calidad perceptiva visual e indicadores cuantitativos a través de diferentes conjuntos de datos.

Me gusta

Guardar