Key points are not available for this paper at this time.
Hier präsentieren wir eine Chatbot-Assistenten-Infrastruktur (https://www.ebi.ac.uk/pride/chatbot/), die die Benutzerinteraktionen mit der PRIDE-Datenbank, dem beliebtesten Proteomics-Datenrepository, vereinfacht. Unser System nutzt zwei fortschrittliche Large Language Models (LLM), llama2-13b und chatglm2-6b, und umfasst eine Webservice-API (Application Programming Interface), eine Weboberfläche und hochentwickelte Algorithmen. Wir haben einen neuartigen Ansatz entwickelt, um vektorbasierten Darstellungen zu konstruieren, die die Antworten der LLM ermöglichen, mit einer kuratierten Version und einer umfassenden Datenbank relevanter Links und Absätze für jede generierte Antwort. Ein wichtiger Teil des Rahmens ist eine Benchmark-Komponente, die auf einem Elo-Rangsystem basiert und eine skalierbare Methode zur Bewertung nicht nur der Leistung von llama2-13b und chatglm2-6b, sondern auch anderer verfügbarer und zukünftiger Open-Source-LLMs bietet. Im Laufe des Benchmarking-Prozesses wurde die PRIDE-Dokumentation für externe Benutzer verfeinert, um die Klarheit und Effizienz bei der Beantwortung von Benutzeranfragen zu verbessern. Wichtig ist, dass unsere Infrastruktur durch ihre Anwendung im Kontext der PRIDE-Datenbank veranschaulicht wird, aber die modulare und anpassungsfähige Natur unseres Ansatzes sie als wertvolles Werkzeug zur Verbesserung der Benutzererfahrungen in einem Spektrum von Bioinformatik- und Proteomics-Tools und -Ressourcen sowie in anderen Bereichen positioniert. Die Integration fortschrittlicher LLMs, innovativer vektorbasierten Konstruktionen, des Benchmarking-Rahmens und optimierter Dokumentation bilden zusammen eine robuste und übertragbare Chatbot-Assistenten-Infrastruktur.
Bai et al. (Tue,) haben diese Frage untersucht.