Wir präsentieren einen multimodalen KI-Laboragenten, der implizite experimentelle Praktiken erfasst und weitergibt, indem er schriftliche Anweisungen mit praktischer Laborarbeit durch die Analyse von Video, Sprache und Text verknüpft. Während aktuelle KI-Tools sich als effektiv bei der Literaturanalyse und der Codegenerierung erwiesen haben, adressieren sie nicht die kritische Lücke zwischen dokumentiertem Wissen und impliziter Laborpraxis. Unser Rahmen überbrückt diese Kluft, indem er die Protokollgenerierung direkt aus von Forschern aufgezeichneten Videos integriert, systematische Erkennung experimenteller Fehler und die Bewertung der Gerätebereitschaft durch den Vergleich der aktuellen Leistungsfähigkeit mit historischen Entscheidungen ermöglicht. Im Bereich der Massenspektrometrie-basierten Proteomik zeigen wir, dass der Agent praktische Expertise über konventionelle Dokumentation hinaus erfassen und weitergeben sowie häufige Fehler identifizieren kann, obwohl die domänenspezifische und räumliche Erkennung noch verbessert werden muss. Dieser agentische Ansatz verbessert die Reproduzierbarkeit und Zugänglichkeit in der Proteomik und bietet ein verallgemeinerbares Modell für andere Bereiche, in denen komplexe, praktische Verfahren dominieren. Diese Studie legt die Grundlage für gemeinschaftlich getriebene, multimodale KI-Systeme, die die Strenge wissenschaftlicher Praktiken ergänzen, anstatt sie zu ersetzen.
Skowronek et al. (Montag) haben diese Frage untersucht.