Die Forschung zur Quantifizierung von Unsicherheiten (UQ) für große Sprachmodelle (LLMs) wird zunehmend wichtig, um die Zuverlässigkeit dieser bahnbrechenden Technologie zu garantieren. Wir untersuchen die Integration von UQ-Methoden in argumentativen LLMs (ArgLLMs), einem erklärbaren LLM-Rahmenwerk für Entscheidungsfindungen, das auf computergestützter Argumentation basiert, wobei UQ eine entscheidende Rolle spielt. Wir führen Experimente durch, um die Leistung von ArgLLMs bei der Überprüfung von Ansprüchen mit verschiedenen UQ-Methoden zu bewerten, wobei wir gleichzeitig eine Bewertung der Effektivität der UQ-Methoden durchführen. Darüber hinaus ist das experimentelle Verfahren selbst eine neuartige Möglichkeit, die Effektivität von UQ-Methoden zu bewerten, insbesondere bei komplexen und potenziell umstrittenen Aussagen. Unsere Ergebnisse zeigen, dass direkte Eingaben trotz ihrer Einfachheit eine effektive UQ-Strategie in ArgLLMs darstellen und erheblich komplexere Ansätze übertreffen.
Zhou et al. (Freitag) untersuchten diese Frage.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: