यह 2019 में GPT-2 से एक लंबा इंतजार था, लेकिन Openai अब अपने नए ओपन वेट लैंग्वेज मॉडल (LLM) को लॉन्च कर रहा है। उन्हें GPT-OSS कहा जाता है, वर्तमान लॉट जिसमें GPT-OSS-120B और GPT-OSS-20B शामिल हैं, जिन्हें “रीज़निंग मॉडल” कहा जाता है, जो कि ओपनईआई के साथ है कि ये मॉडल तर्क कार्यों में समान आकार के खुले मॉडल से अधिक हैं। इस का महत्व एक तरह से ओपनई को वापस लाता है, एक तरह से, एआई सिस्टम के निर्माण के अपने मूल मिशन के लिए जो सभी मानवता को लाभान्वित करता है। इन वर्षों में, आर्टिफिशियल इंटेलिजेंस कंपनी (एआई) ने उस घोषित मिशन के प्रति व्याकुलता की आलोचना का सामना किया है, क्योंकि प्रतियोगिता तेजी से बढ़ी।
“GPT-OSS-12-20B और GPT-OSS-20B की रिलीज़ खुले वजन के मॉडल के लिए एक महत्वपूर्ण कदम आगे बढ़ती है। उनके आकार में, ये मॉडल तर्क और सुरक्षा क्षमताओं दोनों में महत्वपूर्ण प्रगति प्रदान करते हैं। ओपन मॉडल हमारे आवासों के लिए हमारे आवासों को बढ़ाने के लिए एक व्यापक रेंज, कंपनी को एक और अधिक ट्रांसपेरेंट के लिए एक व्यापक रेंज देता है। कंपनी के एक कंपनी के बयान में, कंपनी के एक खाते में।
यह भी पढ़ें:नए Openai के सीईओ फिदजी सिमो ने जोर देकर कहा कि एआई लोगों के हाथों में शक्ति डाल सकता है
GPT-OSS-120B और GPT-OSS-20B मॉडल के विवरण में प्रवेश करने से पहले दो प्रश्नों का उत्तर दिया जाना चाहिए। सबसे पहले, खुले वजन के एलएलएम क्या हैं और नियमित रूप से उपयोग करने वाले एलएलएम से अलग हैं? और दूसरी बात, तर्क मॉडल क्या हैं? पहले को एक बड़े भाषा मॉडल के रूप में बेहतर रूप से परिभाषित किया गया है, जो किसी कंपनी द्वारा सार्वजनिक रूप से जारी की जाती है, इसकी संपूर्णता में, जिसका अर्थ है कि वास्तविक मॉडल के सभी वजन (इसे मापदंडों के रूप में पढ़ें, जिसे एक बिलियन या “बी” द्वारा परिभाषित किया गया है) और कोई भी उपयोगकर्ता इन मॉडलों को अपने स्वयं के हार्डवेयर में पूरी तरह से डाउनलोड कर सकता है।
इसकी तुलना में, सबसे लोकप्रिय एलएलएम जो इसका उपयोग कर सकते हैं, जिसमें ओपनई जीपीटी मॉडल शामिल हैं, साथ ही साथ Google मिथुन 2.5 और एंथ्रोप के क्लाउड सॉनेट 4 के स्वाद, बंद मॉडल हैं, जिसका अर्थ है कि वे एक एप्लिकेशन लेयर के माध्यम से सुलभ हैं, जबकि मॉडल के वजन सार्वजनिक डोमेन में नहीं हैं। इसी समय, लक्ष्य लौ मॉडल, साथ ही कुछ मिस्ट्रल मॉडल, ने हाल के दिनों में खुले वजन पद्धति का पालन किया है।
ओपन वेट एआई मॉडल को ओपन सोर्स मॉडल के साथ भ्रमित नहीं किया जाना चाहिए, हालांकि, अच्छा अंतर यह है कि बाद वाले मॉडल जैसे कि डीपसेक आर 1 भी प्रशिक्षण कोड, डेटा सेट और लिंक किए गए दस्तावेज को सार्वजनिक रूप से उपलब्ध कराते हैं: ओपन वेट मॉडल नहीं करते हैं। प्रशिक्षण कोड और डेटा सेट होने से उपयोगकर्ता या डेवलपर को स्क्रैच से एक खुले स्रोत मॉडल को प्रशिक्षित करने के लिए लौटने की अनुमति मिलती है, अक्सर व्यक्तिगत उपयोग परिदृश्यों के लिए। यह लचीलापन खुले वजन के मॉडल के लिए नहीं है, हालांकि इसकी संपूर्णता में सुलभ है। ऑपरई ने ओपन सोर्स मॉडल लॉन्च नहीं किया है।
दूसरे प्रश्न के लिए, तर्क मॉडल इस अर्थ में कुछ अन्य एलएलएम से थोड़ा भिन्न होते हैं कि वे विशेष रूप से अपनी अंतिम प्रतिक्रिया उत्पन्न करने से पहले जटिल समस्याओं के “सोच” को अधिक समय बिताने के लिए डिज़ाइन किए गए हैं। विस्तारित तर्क प्रक्रियाओं से कई चरणों की समस्याओं के माध्यम से काम करने के लिए उपयोग करने की उम्मीद है।
GPT-OSS-20B और GPT-OSS-20B पर वापस जाएं, और मुख्य अंतर इसके मापदंडों की संख्या में है। पैरामीटर अनिवार्य रूप से एक मानव मस्तिष्क में सिनैप्स की ताकत के रूप में हैं, जो यह निर्धारित करता है कि परामर्श के लिए एक उत्तर प्रदान करने से पहले, “न्यूरॉन्स” एक दूसरे को कैसे प्रभावित किया जाता है, यह निर्धारित करता है। इस बार, Openai नाम योजना में, थोड़ी उलझन है: GPT-OSS-20B 117 बिलियन का एक पैरामीटर मॉडल है, जबकि सबसे छोटे GPT-20B में 21 बिलियन पैरामीटर हैं।
Openai संदर्भ स्कोर अधिकांश परीक्षणों में O3 और O4-Mini मॉडल के पास GPT-AS-1220B और GPT-OSS-20B मॉडल में सेट किए गए हैं। उदाहरण के लिए, MMLU संदर्भ बिंदु, जिसमें शैक्षणिक विषयों के बीच प्रश्न शामिल हैं: GPT-OSS-1220B ने 90% सटीकता वापस कर दी, जबकि GPT-OSS-20B ने 85.3% की सटीकता दर्ज की; इसकी तुलना में, O3 (93.4%), O4-Mini (93%) और O3-Mini (87%) नए खुले वजन मॉडल को भर्ती कराया जाता है।
यदि आप अपने कंप्यूटर डिवाइस पर इन ओपन वेट मॉडल को डाउनलोड करने और निष्पादित करने के लिए मेमोरी आवश्यकताओं के बारे में आश्चर्य करते हैं, तो OpenAI यह पुष्टि करता है कि GPT-OSS-20B मॉडल को सिस्टम में 80 GB मेमोरी की आवश्यकता होगी, जबकि GPT-OSS-20B को कम से कम 16 GB की आवश्यकता होती है। वे कहते हैं कि Microsoft GPT-OSS-20B मॉडल के GPU द्वारा विंडोज डिवाइसेस के लिए अनुकूलित संस्करणों को भी ले जा रहा है।

