Key points are not available for this paper at this time.
Code-Großsprachmodelle (Code LLMs) haben herausragende Leistungen bei codebezogenen Aufgaben gezeigt. Verschiedene Ansätze des Instruction Tunings wurden vorgeschlagen, um die Code-Generierungsleistung vortrainierter Code-LLMs zu verbessern. In diesem Artikel stellen wir ein vielfältiges Instruktionsmodell (DolphCoder) mit Selbstbewertung für die Code-Generierung vor. Es lernt unterschiedliche Instruktionsziele und kombiniert ein Code-Evaluationsziel, um seine Fähigkeit zur Code-Erzeugung zu steigern. Unser Modell erzielt überragende Ergebnisse auf den Benchmarks HumanEval und MBPP und liefert neue Erkenntnisse für zukünftige Arbeiten zum Instruction Tuning von Code. Unsere wichtigsten Erkenntnisse sind: (1) Das Ergänzen vielfältigerer Antworten mit unterschiedlichen logischen Denkpfaden erhöht die Code-Fähigkeit von LLMs. (2) Die Verbesserung der Fähigkeit, die Korrektheit von Code-Lösungen zu bewerten, steigert auch die Fähigkeit, diese zu erstellen.
Wang et al. (Wed,) haben diese Frage untersucht.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: