Key points are not available for this paper at this time.
Sistemas de diálogo orientados a tarefas (TOD) são comumente projetados com a presunção de que cada enunciado representa uma única intenção. No entanto, essa suposição pode não refletir com precisão situações do mundo real, onde os usuários frequentemente expressam múltiplas intenções em um único enunciado. Embora haja um interesse emergente na detecção de múltiplas intenções (MID), conjuntos de dados existentes no domínio, como MixATIS e MixSNIPS, têm limitações em sua formulação. Para abordar essas questões, apresentamos o BlendX, um conjunto de conjuntos de dados refinados com padrões mais diversos do que seus predecessores, elevando tanto sua complexidade quanto diversidade. Para a construção dos conjuntos de dados, utilizamos tanto heurísticas baseadas em regras quanto uma ferramenta generativa -- o ChatGPT da OpenAI -- que é potencializada com uma estratégia orientada por similaridade para a seleção de enunciados. Para garantir a qualidade dos conjuntos de dados propostos, também introduzimos três métricas novas que avaliam as propriedades estatísticas de um enunciado relacionadas à contagem de palavras, uso de conjunções e uso de pronomes. Experimentos extensivos com o BlendX revelam que modelos de MID de última geração têm dificuldades com os desafios impostos pelos novos conjuntos de dados, destacando a necessidade de reexaminar o estado atual do campo de MID. O conjunto de dados está disponível em https://github.com/HYU-NLP/BlendX.
Yoon et al. (Quarta-feira,) estudaram esta questão.