Los puntos clave no están disponibles para este artículo en este momento.
Para mitigar los riesgos potenciales asociados con los modelos de lenguaje (LMs), investigaciones recientes sobre detección de IA proponen incorporar marcas de agua en el texto generado por máquinas mediante restricciones de vocabulario aleatorias y utilizar esta información para la detección. En este artículo, mostramos que los algoritmos de marca de agua diseñados para LMs no pueden aplicarse sin problemas a tareas de generación de texto condicional (CTG) sin una notable disminución en el rendimiento de las tareas posteriores. Para abordar este problema, introducimos un algoritmo de marca de agua simple pero efectivo que considera las características de la generación de texto condicional con el contexto de entrada. En comparación con las marcas de agua de referencia, nuestra marca de agua propuesta da lugar a mejoras significativas tanto en evaluaciones automáticas como humanas en varios modelos de generación de texto, incluidos BART y Flan-T5, para tareas de CTG como la resumen y la generación de texto a partir de datos. Mientras tanto, mantiene la capacidad de detección con puntuaciones z más altas pero puntuaciones AUC más bajas, sugiriendo la presencia de un paradoja de detección que plantea desafíos adicionales para la marcación de agua en CTG.
Fu et al. (Sun,) estudiaron esta cuestión.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: