What does this research mean for the field?

The proposed U-Net framework enables effective and scalable hiding and revealing of textual information in video streams with character recovery accuracies between 81% and 88%. Novelty: ClaimNovelty.NOVEL_FINDING. Consensus alignment: ConsensusAlignment.NEUTRAL.

What question did this study set out to answer?

La investigación tiene como objetivo desarrollar un marco de aprendizaje profundo para incrustar y recuperar texto dentro del contenido de video.

March 1, 2026Open Access

Esteganografía profunda con U-Net: Ocultando y revelando texto en video

Puntos clave

La investigación tiene como objetivo desarrollar un marco de aprendizaje profundo para incrustar y recuperar texto dentro del contenido de video.
Se utilizó la arquitectura U-Net para incrustar y revelar texto en videos
Se emplearon estrategias de selección de región de interés (ROI) y de incrustación basada en parches
Se usó una red de ocultación para codificar datos textuales en parches de imagen
Se implementó una línea de reconocimiento óptico de caracteres (OCR) para la extracción de texto
Se lograron precisiones de recuperación de caracteres entre el 81% y el 88%
Se mantuvo una alta fidelidad visual en los videos estego (información oculta)
se demostró un manejo efectivo del ocultamiento de texto dentro de flujos de video

Resumen

La esteganografía basada en video ha atraído una atención creciente debido a su alta capacidad de carga y mejorada imperceptibilidad en comparación con enfoques basados en imagen. En este estudio, se propone un marco esteganográfico basado en aprendizaje profundo para incrustar y recuperar información textual dentro del contenido de video utilizando la arquitectura U-Net. A diferencia de las técnicas tradicionales basadas en el bit menos significativo (LSB), el método propuesto utiliza la selección de región de interés (ROI) y la incrustación basada en parches para mejorar la robustez y la calidad visual. Los datos textuales se codifican primero en parches de imagen y se incrustan en regiones seleccionadas de los fotogramas de video a través de una red de ocultación entrenada. Se emplea una red de revelado correspondiente para recuperar la información oculta, seguida de una línea de reconocimiento óptico de caracteres (OCR) para la extracción de texto. Los resultados experimentales demuestran precisiones de recuperación de caracteres entre el 81% y el 88% mientras se preserva una alta fidelidad visual en los videos estego. Este marco guiado por ROI U-Net proporciona una solución efectiva y escalable para el ocultamiento seguro e imperceptible de texto en flujos de video.

Me gusta

Guardar

Ver artículo completo