NVIDIA में नवीनतम ब्लैकवेल चिप्स ने बड़े कृत्रिम बुद्धिमत्ता प्रणालियों के प्रशिक्षण को काफी आगे बढ़ाया है, जिससे बड़े पैमाने पर भाषा मॉडल को प्रशिक्षित करने के लिए आवश्यक चिप्स की मात्रा कम हो गई है, जैसा कि बुधवार को प्रकाशित नए डेटा में दिखाया गया है।MlCommons द्वारा प्रकाशित परिणाम, एक गैर -लाभकारी संगठन जो AI सिस्टम के लिए संदर्भ प्रदर्शन परिणाम जारी करता है, NVIDIA चिप्स और उन्नत उपकरणों (AMD) के बीच विस्तृत सुधार, दूसरों के बीच, रायटर ने बताया। संदर्भ बिंदु एआई के प्रशिक्षण पर ध्यान केंद्रित करते हैं, जिस चरण में सिस्टम विशाल डेटा सेट से सीखते हैं, जो एआई के अनुमान के बढ़ते बाजार दृष्टिकोण के बावजूद एक प्रमुख प्रतिस्पर्धी सीमा बनी हुई है, या उपयोगकर्ता परामर्शों का जवाब देती है।एक महत्वपूर्ण खोज यह थी कि NVIDIA और इसके साथी केवल वही थे जिन्होंने एक बड़े -स्केल मॉडल को प्रशिक्षित करने के लिए डेटा भेजा था क्योंकि यह 3.1 405B, एक ओपन सोर्स IA सिस्टम प्लेटफार्मों को अरब मापदंडों के साथ कॉल करता है। यह मॉडल आधुनिक चिप्स का परीक्षण करने और उनकी वास्तविक प्रशिक्षण क्षमताओं को उजागर करने के लिए पर्याप्त जटिल है।आंकड़ों के अनुसार, नई NVIDIA ब्लैकवेल चिप्स पिछली पीढ़ी के हॉपर चिप्स की तुलना में चिप द्वारा दोगुनी से अधिक तेजी से अधिक है। सबसे तेज़ परिणाम में, 2,496 ब्लैकवेल चिप्स के एक समूह ने प्रशिक्षण कार्य को केवल 27 मिनट में पूरा किया। इसके विपरीत, उस प्रदर्शन से मेल खाने या सुधारने के लिए हॉपर चिप्स की संख्या तीन गुना से अधिक थी।एक संवाददाता सम्मेलन में, कोरविवे में उत्पादों के निदेशक सेतन कपूर, जिन्होंने संदर्भ परीक्षणों में एनवीडिया के साथ सहयोग किया, ने एक व्यापक उद्योग प्रवृत्ति पर प्रकाश डाला।कपूर ने कहा, “इस तरह की एक कार्यप्रणाली का उपयोग करते हुए, वे इन पागल मल्टीमिलियनेयर पैरामीटर मॉडल आकारों में से कुछ को प्रशिक्षित करने के लिए समय को तेज या कम करना जारी रख सकते हैं,” कपूर ने कहा, छोटे चिप्स के समूहों से बने मॉड्यूलर प्रशिक्षण इन्फ्रास्ट्रक्चर के लिए बड़े पैमाने पर अखंड प्रणालियों के परिवर्तन का जिक्र करते हुए।संदर्भ परिणाम एनवीडिया के डोमेन को एआई प्रशिक्षण स्थान में रेखांकित करते हैं, तब भी जब प्रतिद्वंद्वी जैसे कि चीन की गहरी मांग कम चिप्स के साथ प्रतिस्पर्धी प्रदर्शन की मांग करती है। जैसा कि कैरियर हमेशा लंबे समय तक एक -ASA को बढ़ाने के लिए तेज होता है, प्रशिक्षण कार्यों में चिप्स की दक्षता एक महत्वपूर्ण मीट्रिक बनी हुई है।
Nvidia ब्लैकवेल डबल प्रशिक्षण गति, mlcommons बेंचमार्क शो
