Key points are not available for this paper at this time.
Die Extraktion expliziter Denkketten hat sich als effektive Methode zur Verbesserung der Denkfähigkeiten großer Sprachmodelle (LLMs) bei verschiedenen Aufgaben herausgestellt. Bei komplexen Aufgaben, die erhebliche Herausforderungen für moderne Modelle darstellen, hat diese Technik jedoch oft Schwierigkeiten, effektive Denkketten zu produzieren, die zu richtigen Antworten führen. In dieser Arbeit schlagen wir einen neuartigen Ansatz vor, um die Denkfähigkeiten von LLMs zu extrahieren, indem wir ihre Fähigkeit nutzen, Lösungen zu erklären. Wir wenden unsere Methode zur Lösung von Programmierherausforderungen auf Wettbewerbsniveau an. Konkret verwenden wir ein LLM, um Erklärungen für ein Set von Paaren zu generieren, und nutzen dann die Paare, um ein kleineres Sprachmodell, das wir als Reasoner bezeichnen, feinzutunen, damit es algorithmisches Denken erlernt, das "Wie-man-löst"-Hinweise für unbekannte Probleme generieren kann. Unsere Experimente zeigen, dass das Lernen aus Erklärungen es dem Reasoner ermöglicht, die Programmimplementierung durch einen Coder effektiver zu führen, was zu höheren Lösungsraten als bei starken Baselines von Denkketten bei Programmierproblemen auf Wettbewerbsniveau führt. Es übertrifft auch Modelle, die direkt aus Paaren lernen. Wir haben einen zusätzlichen Testdatensatz im CodeContests-Format zusammengestellt, der 246 neuere Probleme umfasst, die nach dem Kenntnisstand der Modelle veröffentlicht wurden.
Li et al. (Thu,) untersuchten diese Frage.