माउंटेन व्यू, कैलिफोर्निया: Google मिथुन के आर्टिफिशियल इंटेलिजेंस (AI) मॉडल ने एक महत्वपूर्ण कदम उठाया है। इस वर्ष के Google I/या 2025 के प्रमुख नोट में, Suctar Pichai, जो Google और Alphabet के सीईओ हैं, और Google DeepMind के सीईओ, डेमिस हसाबिस ने चैटबॉट के लिए कंपनी की दृष्टि का खुलासा किया, जो सार्वभौमिक बहुमुखी के सहायक के लिए विकसित होना चाहिए। या अन्य कंपनियों के रूप में इस प्रवृत्ति, एआई या एजेंट के एजेंटों को कहते हैं। Google की मौजूदा परियोजनाओं में से दो ने मिथुन के नियोजित परिवर्तन में महत्वपूर्ण योगदान दिया: प्रोजेक्ट एस्ट्रा, एआई का एक स्थितिजन्य संदर्भ देने के लिए, वीडियो, स्क्रीन और मेमोरी एक्सचेंज की समझ के रूप में, साथ ही प्रोजेक्ट मेरिनर, जो ब्राउज़रों से शुरू होने वाले मानव एजेंट इंटरैक्शन के भविष्य की पड़ताल करता है।

प्रमुख नोट के अलावा, एचटी ने एंजेला सन, उत्पादों के निदेशक, मिथुन अनुप्रयोगों के साथ बात की, बेहतर ढंग से यह समझने के लिए कि आईए सहायक की दृष्टि को समय के साथ कैसे समायोजित किया गया था, प्रमुख तकनीकी चुनौतियों और नैतिक विचारों के साथ -साथ उपयोगकर्ता के अनुभव जो एक महत्वपूर्ण परिवर्तन का अनुभव कर रहे हैं। सूर्य आयरनवुड सिलिकॉन, सातवीं पीढ़ी के टेंशनर प्रोसेसिंग यूनिट, या टीपीयू को श्रेय देता है, जो बड़े -स्केल इंट्रेंस के लिए अनुकूलित है। “यह वही है जो IA में इन सभी अग्रिमों को खिलाता है। हर दिन एक हार्डवेयर और सिलिकॉन दृष्टिकोण से अनुकूलन और दक्षता के लिए हमारा दृष्टिकोण। यह वास्तव में एआई की रीढ़ है,” वह कहती हैं। संपादित अर्क।
Q. एक सार्वभौमिक एआई सहायक के लिए हमने जो दृष्टि देखी है वह अद्भुत है। क्या आप हमें इस बात का अंदाजा दे सकते हैं कि यह दृष्टि समय के साथ कैसे ट्यून थी? और इस अर्थ में, क्या दो परियोजनाएं (एस्ट्रा और मेरिनर) इस समय की तैयारी कर रहे थे?
एंजेला सन: हमारी दृष्टि वास्तव में IA सहायक की यह सही अभिव्यक्ति है। सभी ने आज पहली बार, उस का एक विकास और हमारे लिए इसका एक अतिरिक्त परिभाषा सुनी। हमारी दृष्टि वास्तव में मिथुन को सबसे व्यक्तिगत, सक्रिय और शक्तिशाली सहायक बनाने के लिए है। अर्थात्, उपयोगकर्ताओं को अपने दैनिक जीवन के साथ मदद करें। जैसा कि हर कोई हमारे रोड मैप और प्रोजेक्ट एस्ट्रा और प्रोजेक्ट मेरिनर के रूप में चीजों के बारे में सोचता है, यह उपयोगकर्ताओं के साथ काम करने के बारे में है और उपयोगकर्ताओं के नाम पर भी वास्तव में उन तीन पी में शामिल होने के लिए वास्तव में मूल्य देने के लिए।
Q. क्या आप प्रमुख तकनीकी चुनौतियों और मिथुन को वास्तव में सार्वभौमिक बनाने में शामिल नैतिक विचारों को विस्तृत कर सकते हैं, और Google इन विकासवादी चुनौतियों और चिंताओं को कैसे संबोधित करेगा?
जैसा: मुझे लगता है कि इसके लिए सबसे अच्छी चीजों में से एक उपयोगकर्ताओं की प्रतिक्रिया है और इसे उन टिप्पणियों में जारी रखें। और यहाँ मैं एआई के हमारे सिद्धांतों को इंगित करूंगा, जो वास्तव में बोल्ड और जिम्मेदार दोनों है। और फिर बोल्ड का क्या मतलब है? इसका मतलब है कि हम नया कर सकते हैं। हम इस तकनीक की सीमाओं को आगे बढ़ाते रहते हैं और, जैसा कि सभी ने I/या 2025 में कई विज्ञापनों को सुना, हम वास्तव में इसे कैसे फ्रेम करते हैं। यहां एस्ट्रा प्रोजेक्ट है, यहां प्रोजेक्ट मेरिनर है, और यहां ये प्रौद्योगिकियां हैं जो केवल नवजात अनुसंधान प्रोटोटाइप के इन चरणों में हैं और हमारे पास विश्वास परीक्षकों का यह समूह है जहां हम वास्तव में प्रौद्योगिकी और सीमाओं की ताकत और सीमाओं को समझने की कोशिश करते हैं। लेकिन फिर आप विकास कर सकते हैं। और मुझे लगता है कि यह वास्तव में l succinity के प्रमुख नोट का हिस्सा है।
वह विकास कैसे काम करता है? मिथुन लाइव जैसे एस्ट्रा आम तौर पर उपलब्ध उत्पाद कैसे बनता है? Mariner सामान्य रूप से अधिक उपलब्ध उत्पाद कैसे बनता है? और इसलिए, उस विकास से गुजरना और उस होने के कारण, और मैं कहूंगा कि Google जांच में क्या है, इस बारे में बहुत पारदर्शी है। फिर, उस जीवन चक्र को देखकर, जिसे कभी -कभी महीनों लग सकते हैं, कभी -कभी थोड़ा और, उस पारदर्शिता में मदद करता है। न केवल सार्वजनिक रूप से, बल्कि, जैसा कि मैंने उल्लेख किया है, उपयोगकर्ताओं और परीक्षकों के साथ हम जो परीक्षण करते हैं, उसे जारी रखने के लिए, यह वास्तव में हमारे लिए महत्वपूर्ण है।
Q. अंतर्निहित वास्तुशिल्प या प्रशिक्षण नवाचार क्या हैं जिन्होंने इस स्तर के उन्नत तर्क को गहरे विचार के साथ अनुमति दी, विशेष रूप से गणित, कोड और मल्टीमॉडलिटी के साथ?
जैसा: मैं कहूंगा कि कोडिंग निश्चित रूप से एक बड़ा है जिसमें हम ध्यान केंद्रित करते हैं, लेकिन इन मॉडलों में हम जो मूल्यांकन करते हैं, उसमें से कई में वापस जाते हैं, इसलिए वे बढ़ते और विकसित होते रहते हैं। मुझे लगता है कि गणित, कोडिंग और मल्टीमॉडल कुछ मुख्य हैं जिन्होंने आज देखा था। लेकिन मूल्यांकन सेट बढ़ रहे हैं और लगातार विकसित हो रहे हैं क्योंकि हम इस तकनीक के साथ भी आगे बढ़ते हैं।
गहरी सोच के लिए, या जैसा कि मिथुन 2.5 मॉडल के साथ, यह वास्तव में एक मजबूत और अधिक शक्तिशाली एलएलएम है। वास्तुशिल्प रूप से यह बड़े भाषा मॉडल की वास्तुकला के अनुरूप है, लेकिन आप अपनी सोच प्रक्रिया को 2.0 के दौरान दिखाने की क्षमता रख सकते हैं। और फ्लैश मॉडल एक छोटे आकार के हैं। मॉडल का आकार और मॉडल दक्षता निश्चित रूप से महत्वपूर्ण हैं। हमारे सबसे कुशल और अनुकूलित मॉडल के लिए, हम कहते हैं, वे सरल दैनिक कार्यों और परामर्शों के लिए अधिक हैं और यदि आप एक मजबूत मॉडल चाहते हैं, तो आपके पास सबसे गहरे विचार मॉडल में से एक का उपयोग करने के लिए उपलब्धता है जो क्षमता में अधिक गहन हैं, लेकिन वे आपको विचार की प्रक्रिया दिखाएंगे।
पी। कैमरे और मिथुन लाइव के स्क्रीन एक्सचेंज के साथ, कार्य स्थान और क्रोम की परतों और एंड्रॉइड एक्सआर की परतों के साथ, उपयोगकर्ता का अनुभव एक महत्वपूर्ण परिवर्तन का अनुभव कर रहा है। यह सुनिश्चित करना कितना चुनौतीपूर्ण है कि ये नई क्षमताएं सहज हैं?
जैसा: यह हर दिन के लिए एक बहुत ही महत्वपूर्ण सवाल है जो हम खुद से पूछते हैं। और विशेष रूप से जब उपयोगकर्ता का व्यवहार बदलता है, तो इन नई तकनीकों को अपनाना, जो शुरुआत में सहज महसूस नहीं कर सकता है क्योंकि यह पहले कभी अस्तित्व में नहीं था, हमने इसे यथासंभव तरल पदार्थ करने की कोशिश की। मुझे लगता है कि एआई के साथ खिलाए गए सहायकों की सुंदरियों में से एक प्राकृतिक भाषा है। यह वास्तव में लगातार नहीं था, क्योंकि यह हाल के वर्षों में रहा है। तो एक चेतावनी के रूप में चीजें कैसे सरल हैं? आप वास्तव में चीजों को कैसे सहज बनाते हैं कि लोग स्वाभाविक रूप से कैसे बोलते हैं, यह भाषा या स्टाइल के दृष्टिकोण से है या नहीं, लोग कैसे बोलते हैं? मेरे दो छोटे बच्चे हैं, मेरा पांच -वर्षीय बेटा मिथुन से बहुत अलग तरह से बात करता है कि मैं कैसे बोलता हूं, भले ही यह एक ही अंग्रेजी भाषा हो। इसलिए, सुनिश्चित करें और वास्तव में उस प्राकृतिक भाषा में लंगर डालें, मुझे लगता है कि प्राकृतिक बातचीत मुझे लगता है कि वर्तमान तकनीक में एक फायदा है।