May 24, 2023Open Access

गोरिल्ला: विशाल API के साथ जुड़े बड़े भाषा मॉडल

Key Points

Key points are not available for this paper at this time.

Abstract

हाल ही में बड़े भाषा मॉडलों (LLMs) ने शानदार प्रगति की है, और अब मॉडल विभिन्न कार्यों में उत्कृष्टता प्राप्त कर रहे हैं, जैसे गणितीय तर्क और प्रोग्राम संश्लेषण। हालाँकि, उनके लिए API कॉल के माध्यम से उपकरणों का प्रभावी ढंग से उपयोग करने की क्षमता पूरी नहीं हुई है। यह आज के अत्याधुनिक LLMs जैसे GPT-4 के लिए एक चुनौतीपूर्ण कार्य है, मुख्यतः उनके सटीक इनपुट तर्कों को उत्पन्न करने में असमर्थता और API कॉल के गलत उपयोग की दृष्टि से हॉलुसिनेट करने की प्रवृत्ति के कारण। हम गोरिल्ला, एक फाइन-ट्यून किए गए LLaMA-आधारित मॉडल को पेश करते हैं जो API कॉल लिखने में GPT-4 के प्रदर्शन को पार करता है। जब इसे एक दस्तावेज़ पुनर्प्राप्तकर्ता के साथ जोड़ा जाता है, तो गोरिल्ला परीक्षा के समय दस्तावेज़ परिवर्तनों के अनुकूल होने की एक मजबूत क्षमता प्रदर्शित करता है, जो लचीले उपयोगकर्ता अपडेट या संस्करण परिवर्तनों को सक्षम करता है। यह सीधे LLMs को उत्तेजित करते समय सामान्यतः सामना की जाने वाली हॉलुसिनेशन की समस्या को भी काफी हद तक कम करता है। मॉडल की क्षमता का मूल्यांकन करने के लिए, हम APIBench पेश करते हैं, जो HuggingFace, TorchHub, और TensorHub APIs का एक व्यापक डेटा सेट है। गोरिल्ला के साथ पुनर्प्राप्ति प्रणाली का सफल एकीकरण LLMs के उपकरणों का अधिक सटीकता से उपयोग करने की संभावनाएं दिखाता है, अक्सर अद्यतन दस्तावेज़ों के साथ तालमेल बनाए रखता है, और इस प्रकार उनके आउटपुट की विश्वसनीयता और अनुप्रयोगशीलता बढ़ाता है। गोरिल्ला का कोड, मॉडल, डेटा और डेमो https://gorilla.cs.berkeley.edu पर उपलब्ध है।

Bookmark

View Full Paper

Bookmark

View Full Paper

गोरिल्ला: विशाल API के साथ जुड़े बड़े भाषा मॉडल

Key Points

Abstract

Cite This Study