What type of study is this?

This is a Experimental Study study.

October 2, 2025Open Access

Conversaciones Personalizadas más Allá de los LLMs: Un Gestor de Diálogo Basado en RL

Puntos clave

El gestor de diálogo basado en RL supera a una línea base de LLM de última generación al lograr mejores recompensas, mejorando la eficacia del diálogo con datos limitados.
La integración del aprendizaje por refuerzo jerárquico y el meta-aprendizaje conduce a una mejor adaptabilidad y eficiencia en la gestión de interacciones con los usuarios.
Este método personaliza las respuestas a las diversas necesidades de los pacientes, demostrando su aplicabilidad en el fomento del cambio de comportamiento a través de entrevistas motivacionales.
La capacidad del marco para transitar fluidamente entre fases de diálogo marca un avance significativo en los sistemas de diálogo abiertos.

Resumen

En este trabajo, proponemos un nuevo marco que integra modelos de lenguaje grandes (LLMs) con un gestor de diálogo basado en RL para diálogos abiertos con un objetivo específico. Al aprovechar el aprendizaje por refuerzo jerárquico para modelar las fases estructuradas del diálogo y emplear el meta-aprendizaje para mejorar la adaptabilidad a través de diversos perfiles de usuario, nuestro enfoque mejora la adaptabilidad y eficiencia, permitiendo al sistema aprender de datos limitados, transitar fluidamente entre fases de diálogo y personalizar respuestas a necesidades heterogéneas de los pacientes. Aplicamos nuestro marco a Entrevistas Motivacionales, con el objetivo de fomentar el cambio de comportamiento, y demostramos que el gestor de diálogo propuesto supera a una línea base de LLM de última generación en términos de recompensa, mostrando un beneficio potencial de condicionar LLMs para crear sistemas de diálogo abiertos con objetivos específicos.

Leer artículo completoexternamente

Preguntar a la IA

Me gusta

Guardar

Ver artículo completo