Key points are not available for this paper at this time.
Formeln sind die Sprache der Kommunikation zwischen Menschen und der Natur. Es ist ein wichtiges Forschungsthema der künstlichen Intelligenz, Ausdrücke aus beobachteten Daten zu finden, die die Beziehung zwischen jeder Variablen in den Daten widerspiegeln, was als symbolisches Regressionsproblem bezeichnet wird. Die bestehenden symbolischen Regressionsmethoden erzeugen direkt Ausdrücke auf der Grundlage der gegebenen Beobachtungsdaten, und wir können von dem Algorithmus nicht verlangen, Ausdrücke zu generieren, die spezifischen Anforderungen gemäß dem bekannten Vorwissen entsprechen. Zum Beispiel muss der Ausdruck enthalten sein oder symmetrisch sein und so weiter. Selbst wenn dies möglich ist, erfordert es oft sehr komplexe Operationen, was sehr unpraktisch ist. In dieser Arbeit schlagen wir, basierend auf multimodalen großen Sprachmodellen, MLLM-SR vor, eine konversationelle symbolische Regressionsmethode, die Ausdrücke generieren kann, die den Anforderungen entsprechen, einfach durch die Beschreibung der Anforderungen mit natürlichen Sprachinstruktionen. Durch Experimente mit dem Nguyen-Datensatz können wir zeigen, dass MLLM-SR die state-of-the-art Basislinien in der Anpassungsleistung übertrifft. Noch bemerkenswerter ist, dass wir experimentell nachweisen, dass MLLM-SR das Vorwissen, das wir zu den natürlichen Sprachinstruktionen hinzufügen, gut verstehen kann. Darüber hinaus kann die Hinzufügung von Vorwissen MLLM-SR effektiv anleiten, korrekte Ausdrücke zu generieren.
Li et al. (Sat,) haben diese Frage untersucht.