March 30, 2024Open Access

Edinburgh Clinical NLP bei SemEval-2024 Aufgabe 2: Passen Sie Ihr Modell an, es sei denn, Sie haben Zugang zu GPT-4

Key Points

Key points are not available for this paper at this time.

Abstract

Die NLI4CT-Aufgabe bewertet Systeme für natürliche Sprachinferenz hinsichtlich ihrer Fähigkeit, vorherzusagen, ob Hypothesen Beweise aus klinischen Studienberichten beinhalten oder widerlegen. In dieser Studie bewerten wir verschiedene Large Language Models (LLMs) mit mehreren Strategien, einschließlich Chain-of-Thought, In-Context Learning und parametrisch effizientes Fine-Tuning (PEFT). Wir schlagen eine PEFT-Methode vor, um die Konsistenz der LLMs zu verbessern, indem wir Adapter kombinieren, die separat mit Triplet- und Sprachmodellierungszielen feinabgestimmt wurden. Wir haben festgestellt, dass das Zusammenführen der beiden PEFT-Adapter den F1-Score (+0,0346) und die Konsistenz (+0,152) der LLMs verbessert. Unsere neuartigen Methoden lieferten jedoch keine genaueren Ergebnisse als GPT-4 in Bezug auf Treue und Konsistenz. Durch das Mittelwertbilden der drei Metriken belegt GPT-4 den geteilten ersten Platz im Wettbewerb mit 0,8328. Schließlich zeigt unsere Kontaminationsanalyse mit GPT-4, dass es keinen Datenleck aus den Tests gab.

Edinburgh Clinical NLP bei SemEval-2024 Aufgabe 2: Passen Sie Ihr Modell an, es sei denn, Sie haben Zugang zu GPT-4

Key Points

Abstract

Cite This Study

Also Consider

Also Consider