What type of study is this?

This is a Experimental Study study.

October 8, 2025Open Access

CReFT-CAD: Verbesserung des orthografischen Projektionsdenkens für CAD durch Verstärkungsfine-Tuning

Key Points

CReFT-CAD verbessert die Genauigkeit des orthografischen Projektionsdenkens in CAD-Workflows und adressiert die Einschränkungen der aktuellen Deep-Learning-Methoden.
Die neue Methode verbessert die Leistung außerhalb der Verteilung bei komplexen Denkaufgaben und basiert auf curriculum-gesteuertem Verstärkungslernen.
Mit einem großen Datensatz von 200.000 synthetischen und 3.000 realen Projektionen fördert die Benchmark das Verständnis für CAD-bezogene Herausforderungen.
Der Ansatz bietet wertvolle Einblicke für zukünftige Forschungen zum CAD-Denken und hat das Potenzial, industrielle Designprozesse zu transformieren.

Abstract

Computer-Aided Design (CAD) spielt eine zentrale Rolle in der industriellen Fertigung. Das orthografische Projektionsdenken bildet die Grundlage des gesamten CAD-Workflows, einschließlich Design, Fertigung und Simulation. Allerdings verwenden gängige Deep-Learning-Ansätze standardmäßige 3D-Rekonstruktionspipelines als Alternative, die oft ungenaue Abmessungen einführen und die parametrierte Bearbeitbarkeit einschränken, die für CAD-Workflows erforderlich ist. Kürzlich haben einige Forscher Vision-Language-Modelle (VLMs), insbesondere überwacht fine-tuning (SFT), übernommen, um CAD-bezogene Herausforderungen zu meistern. SFT zeigt vielversprechende Ansätze, degeneriert jedoch oft in das Memorieren von Mustern, was zu schlechten Leistungen außerhalb der Verteilung bei komplexen Denkaufgaben führt. Um diese Lücken zu schließen, stellen wir CReFT-CAD vor, ein zweistufiges Fine-Tuning-Paradigma, das zunächst eine curriculum-gesteuerte Verstärkungslernphase mit schwierigkeitssensitiven Belohnungen anwendet, um die Denkfähigkeit schrittweise aufzubauen, und anschließend ein überwacht nachjustieren zur Verfeinerung der Befehlsbefolgung und semantischen Extraktion anwendet. Ergänzend dazu veröffentlichen wir TriView2CAD, die erste umfangreiche, Open-Source-Benchmark für das orthografische Projektionsdenken, die 200.000 synthetische und 3.000 reale orthografische Projektionen mit präzisen Maßannotationen und sechs interoperablen Datenmodalitäten umfasst. Wir benchmarken führende VLMs im orthografischen Projektionsdenken und zeigen, dass CReFT-CAD die Genauigkeit des Denkens und die Generalisierbarkeit außerhalb der Verteilung in realen Szenarien erheblich verbessert, was wertvolle Einblicke für den Fortschritt der Forschung im Bereich CAD-Denken bietet.

CReFT-CAD: Verbesserung des orthografischen Projektionsdenkens für CAD durch Verstärkungsfine-Tuning

Key Points

Abstract

Cite This Study

Also Consider

Also Consider