February 14, 2024Open Access

DolphCoder: Echo-Ortung von Code-Großsprachmodellen mit vielfältigem und multidimensionalem Instruction Tuning

Key Points

Key points are not available for this paper at this time.

Abstract

Code-Großsprachmodelle (Code LLMs) haben herausragende Leistungen bei codebezogenen Aufgaben gezeigt. Verschiedene Ansätze des Instruction Tunings wurden vorgeschlagen, um die Code-Generierungsleistung vortrainierter Code-LLMs zu verbessern. In diesem Artikel stellen wir ein vielfältiges Instruktionsmodell (DolphCoder) mit Selbstbewertung für die Code-Generierung vor. Es lernt unterschiedliche Instruktionsziele und kombiniert ein Code-Evaluationsziel, um seine Fähigkeit zur Code-Erzeugung zu steigern. Unser Modell erzielt überragende Ergebnisse auf den Benchmarks HumanEval und MBPP und liefert neue Erkenntnisse für zukünftige Arbeiten zum Instruction Tuning von Code. Unsere wichtigsten Erkenntnisse sind: (1) Das Ergänzen vielfältigerer Antworten mit unterschiedlichen logischen Denkpfaden erhöht die Code-Fähigkeit von LLMs. (2) Die Verbesserung der Fähigkeit, die Korrektheit von Code-Lösungen zu bewerten, steigert auch die Fähigkeit, diese zu erstellen.

DolphCoder: Echo-Ortung von Code-Großsprachmodellen mit vielfältigem und multidimensionalem Instruction Tuning

Key Points

Abstract

Cite This Study

Also Consider

Also Consider