Key points are not available for this paper at this time.
Em conversas entre médicos e pacientes, identificar informações relevantes do ponto de vista médico é crucial, o que levanta a necessidade de resumos de conversação. Neste trabalho, propomos o primeiro sistema de resumo de fala em tempo real, implantável, para aplicações do mundo real na indústria, que gera um resumo local após cada N enunciados de fala dentro de uma conversa e um resumo global após o término da conversa. Nosso sistema pode melhorar a experiência do usuário do ponto de vista comercial, enquanto também reduz os custos computacionais do ponto de vista técnico. Em segundo lugar, apresentamos o VietMed-Sum que, até onde sabemos, é o primeiro conjunto de dados de resumo de fala para conversas médicas. Em terceiro lugar, somos os primeiros a utilizar LLM e anotadores humanos de forma colaborativa para criar resumos padrão de ouro e sintéticos para o resumo de conversas médicas. Finalmente, apresentamos resultados de referência de modelos de última geração no VietMed-Sum. Todo o código, dados (traduzidos para inglês e vietnamita) e modelos estão disponíveis online.
Le-Duc et al. (Sun,) estudaram essa questão.