What type of study is this?

This is a Quantitative Study study.

October 13, 2025Open Access

HKD4VLM: Un Marco Progresivo de Destilación de Conocimientos Híbridos para la Detección Robusta de Alucinaciones y Veracidad en Modelos Multimodales

Puntos clave

El marco HKD4VLM mejora los modelos multimodales, mejorando tanto la detección de alucinaciones como la verificación de hechos.
Los resultados experimentales destacan que HKD4VLM supera a modelos más grandes, logrando una mayor eficiencia en tareas multimodales.
Este marco emplea destilación en línea progresiva tipo pirámide para refinar efectivamente el conocimiento del modelo.
Las ideas de los estudios de ablación enfatizan decisiones de diseño críticas que impulsan significativamente las mejoras de rendimiento.

Resumen

Impulsado por el rápido avance en los modelos de visión-lenguaje (VLMs), el comportamiento responsable de los modelos multimodales a gran escala se ha convertido en un área de investigación prominente, centrándose particularmente en la detección de alucinaciones y la verificación de hechos. En este artículo, presentamos la solución para las dos pistas del desafío de IA Responsable. Inspiraciones del dominio general demuestran que un VLM destilado más pequeño puede superar a menudo a un VLM más grande que está ajustado directamente en tareas específicas, logrando así una mayor eficiencia. Por lo tanto, abordamos conjuntamente dos tareas desde la perspectiva de la destilación de conocimientos y proponemos un marco progresivo de destilación de conocimientos híbridos denominado HKD4VLM. Específicamente, el marco general puede descomponerse en una destilación en línea progresiva tipo pirámide y una destilación de refinamiento acoplada ternaria, moviéndose jerárquicamente de la alineación de conocimientos de grano grueso a un refinamiento de grano fino. Además, introducimos estrategias de aumento diversas y de inferencia mejorada mediante desplazamiento para mejorar el rendimiento y la robustez del modelo. Resultados experimentales extensivos demuestran la efectividad de nuestro HKD4VLM. Estudios de ablación ofrecen ideas sobre las decisiones de diseño críticas que impulsan las mejoras en el rendimiento.

Leer artículo completoexternamente

Me gusta

Guardar

Ver artículo completo