La esteganografía basada en video ha atraído una atención creciente debido a su alta capacidad de carga y mejorada imperceptibilidad en comparación con enfoques basados en imagen. En este estudio, se propone un marco esteganográfico basado en aprendizaje profundo para incrustar y recuperar información textual dentro del contenido de video utilizando la arquitectura U-Net. A diferencia de las técnicas tradicionales basadas en el bit menos significativo (LSB), el método propuesto utiliza la selección de región de interés (ROI) y la incrustación basada en parches para mejorar la robustez y la calidad visual. Los datos textuales se codifican primero en parches de imagen y se incrustan en regiones seleccionadas de los fotogramas de video a través de una red de ocultación entrenada. Se emplea una red de revelado correspondiente para recuperar la información oculta, seguida de una línea de reconocimiento óptico de caracteres (OCR) para la extracción de texto. Los resultados experimentales demuestran precisiones de recuperación de caracteres entre el 81% y el 88% mientras se preserva una alta fidelidad visual en los videos estego. Este marco guiado por ROI U-Net proporciona una solución efectiva y escalable para el ocultamiento seguro e imperceptible de texto en flujos de video.
Mahmut Sınecen (Vie,) estudió esta cuestión.