Google भारत में मिथुन उपयोगकर्ताओं के लिए नई सुविधाओं का एक महत्वपूर्ण सेट अनलॉक कर रहा है, और देश में एआई को अपनाने का पहला तथ्य प्रकाशित किया है। यह नई सुविधाओं के लिए एक दो -बिंदु दृष्टिकोण है, जो मिथुन के भीतर कृत्रिम बुद्धिमत्ता (एआई) वीडियो उत्पन्न करने की क्षमताओं को एकीकृत करता है, साथ ही एक एआई एजेंट भी जो सांसारिक संदर्भ को समझ सकता है यदि कोई उपयोगकर्ता फोन कैमरा या शेयरों तक पहुंचने की अनुमति देता है या फोन की स्क्रीन पर क्या है। यह, Google को उम्मीद है, मिथुन की प्रासंगिकता का विस्तार करेगा, जो अपने शस्त्रागार उपकरणों में जोड़ता है जिसमें पहले से ही एंड्रॉइड फोन के भीतर गहन एकीकरण, साथ ही साथ Google के कार्य स्थान और खोज में एआई के विवरण शामिल हैं।

प्रतियोगिता का स्पेक्ट्रम भी है। हाल के हफ्तों में, एआई मॉडल के संदर्भ में महत्वपूर्ण प्रगति हुई है जो नई संभावित क्षमताओं को पाते हैं, हालांकि बहुत सी बातचीत बिल्कुल वैसी ही बनी हुई है: संभावित और संभावित उद्देश्य (निश्चित रूप से, संदर्भ बिंदुओं के बारे में बात करने का प्रयास है, लेकिन वास्तविक दुनिया में अनुवाद नहीं हो सकता है)। Opgai के O3 और O4-Mini, XAI ने स्टूडियो को ग्रोक में जोड़ना, क्लाउड डे एंथ्रोप को एक शोध लिफाफा और Microsoft को जोड़ते हुए एज वेब ब्राउज़र में सह-चालक की दृष्टि को जोड़ना, दृष्टिकोण में उपभोक्ताओं के साथ कुछ तेजी से विकास चित्रण। स्पार्क कहा जा सकता है कि यह जनवरी में एआई डेपसेक का शुभारंभ था। प्रसिद्धि के लिए उनका दावा एआई मॉडल बनाने के लिए सस्ती लागतों के नियमों को फिर से लिखा गया था।
“एक रोमांचक विकास मिथुन 2.5 मॉडल का शुभारंभ किया गया है, जिसने वास्तव में एआई की सामान्य क्षमताओं को पूरी तरह से नए स्तर तक पहुंचा दिया है,” एचटी के साथ एक बातचीत में Google दीपमाइंड के वरिष्ठ निदेशक मनीष गुप्ता कहते हैं।
वीडियो जनरेशन मॉडल जिसे मैं 2 देख रहा हूं, अब मिथुन में एकीकरण पाता है, जो इस प्रकार एक चेतावनी के साथ विस्तृत और प्राकृतिक पहलुओं को उत्पन्न करने की क्षमता जोड़ता है। अभी के लिए, यह 720p के रिज़ॉल्यूशन के लिए आठ सेकंड का एक वीडियो बनाता है, जिसे एक लैंडस्केप प्रारूप 16: 9 में MP4 फ़ाइल के रूप में दिया गया है। Google का कहना है कि विस्तृत संकेत महत्वपूर्ण हैं कि उत्पन्न वीडियो कितने अच्छे हैं, चाहे एक छोटी कहानी, एक दृश्य अवधारणा या एक विशिष्ट दृश्य। वीडियो जनरेशन क्षमताएं मिथुन के उन्नत ग्राहकों के लिए अनन्य हैं: भारत में, यह लागत ₹1,950 प्रति माह।
Google भारत में मार्केटिंग के उपाध्यक्ष शेखर खोसला कहते हैं, “भविष्य में, कोई भी इसे वास्तुकला, डिजाइन और सिनेमा जैसे रिक्त स्थान की भीड़ में देख सकता है। इस अर्थ में, इसलिए, हम केवल इसके साथ सतह को स्क्रैप कर रहे हैं, लेकिन गुणवत्ता अकल्पनीय है।”
Google इस बात की पुष्टि करता है कि मिथुन का वीडियो आउटपुट समान नीतियों और सामग्री रेलिंग पर आधारित होगा जो सुरक्षा के संदर्भ में जेनेरिक के उदार उपयोग को परिभाषित करता है, उन परिणामों से बचता है जो हिंसा, बाल शोषण, हिंसा, आत्म -हथियार और खतरनाक गतिविधियों जैसे नशीली दवाओं के उपयोग का प्रतिनिधित्व करते हैं। वास्तविक दुनिया में एक उपयोगकर्ता द्वारा शूट करने वालों से उत्पन्न वीडियो को अलग करने के लिए, इन पीढ़ियों में प्रत्येक पेंटिंग में एकीकृत सिंथिड डिजिटल ब्रांड होगा, यह दर्शाता है कि वीडियो एआई द्वारा उत्पन्न होते हैं।
“उन चीजों में से एक जिनमें हमने एक कंपनी के रूप में कुछ नेतृत्व योगदान दिया है, जो कि सिंथेसाइज़र आईडी नामक तकनीक में है। यह एक शक्तिशाली तकनीक है जहां विभिन्न प्रकार की सामग्री, चाहे वीडियो या छवि या पाठ, हम एक डिजिटल हस्ताक्षर बना सकते हैं जो उस सामग्री को एक उत्पन्न के रूप में पहचानता है।
सिंथ की आईडी अब एक खुले स्रोत के रूप में भी उपलब्ध है।
साथ में, मिथुन लाइव अब एंड्रॉइड फोन के माध्यम से आ रहा है जो मिथुन एप्लिकेशन (पिक्सेल 9 Google के अपने फोन, और सैमसंग गैलेक्सी S25 अल्ट्रा सहित) को चलाने में सक्षम है, और फोन कैमरे के माध्यम से एक उपयोगकर्ता के आसपास दुनिया के संदर्भ को समझ सकता है या स्क्रीन पर क्या है। कैमरे का संदर्भ समस्याओं को हल करने में मदद कर सकता है यदि इसके चारों ओर एक भौतिक वस्तु सही तरीके से काम नहीं करती है या एक महत्वपूर्ण स्थान को व्यवस्थित करने में मदद करती है।
मिथुन लाइव के साथ फोन स्क्रीन पर क्या साझा करने की क्षमता का मतलब है कि एक परियोजना के साथ शुरू करने में मदद करना, गणना के साथ सहायता या यहां तक कि अध्ययन और यहां तक कि युक्तियों को खरीदना।
मिथुन लाइव की अधिकांश प्रासंगिक खुफिया एस्ट्रा प्रोटोटाइप परियोजना से उभरती है, जिसे कंपनी ने ट्रस्टेड टेस्टर्स प्रोग्राम को उपलब्ध कराया था। सबसे सक्षम मिथुन लाइव को एक उन्नत मिथुन सदस्यता की आवश्यकता नहीं होती है, और उन सभी एंड्रॉइड फोन पर उपलब्ध है जो डिवाइस पर आईए मिथुन सहायक को चलाने में सक्षम हैं। अभी के लिए, यह ज्ञात नहीं है कि जब मिथुन लाइव अपडेट किया गया था, तो Apple के iPhone को आपके तह में लाएगा।
मिथुन लाइव प्रतिक्रियाओं का मूल्य लोगों के लिए भिन्न हो सकता है, लेकिन Google को प्रासंगिक मदद के लिए कई भारतीय भाषाओं के समर्थन की उम्मीद है। मिथुन, इस समय, भारतीय भाषाओं के स्पेक्ट्रम के बीच हिंदी, बेंगालि, गुजराती, कन्नड़, मलयालम, तमिल, तेलुगु और उर्दू का समर्थन करता है।
गुप्ता द विजन बताते हैं, “हम खुश नहीं हैं और हम और अधिक करना चाहते हैं। अंतर्निहित मॉडल में कई और भाषाएं शामिल हैं और हम 22 अनुसूचित भाषाओं से आगे जाने की कोशिश कर रहे हैं, जिसे पवित्र कब्र माना जाता है। भारत में कई भाषाएं बोली जाती हैं और हम चाहते हैं कि हमारे मॉडल 100 से अधिक भारतीय भाषाओं को समझें।”
यह भी पढ़ें: एआई एजेंट रचनात्मकता पर पुनर्विचार करने का एक अवसर हैं: गोविंद बालाकृष्णन डी एडोब
कुछ हफ़्ते पहले, Google ने मिथुन 2.5 मॉडल लॉन्च किया था, कि Google डीपमाइंड के सीईओ, डेमिस हसाबिस ने कॉल किया, “एक अविश्वसनीय अवंत -गार्ड मॉडल, नंबर 1 एलएमएआरएएनए में ईएल के विशाल +39 अंक के लिए, मल्टीमॉडल तर्क, कोडिंग और स्टेम में सभी क्षेत्रों में महत्वपूर्ण सुधार के साथ।” मिथुन 2.5 प्रो (प्रायोगिक) और मिथुन 2.0 फ्लैश रीज़निंग मॉडल सहित उपयोगकर्ताओं के लिए उपलब्ध वर्तमान मिथुन मॉडल लाइन में एक गहन अनुसंधान समारोह शामिल है, जिसमें एआई जटिल मुद्दों का विश्लेषण कर सकता है और विस्तृत रिपोर्ट उत्पन्न कर सकता है।
एक डेटा प्रश्न और प्रासंगिकता
आर्टिफिशियल इंटेलिजेंस (एआई) को अपनाने से अभी तक भारत में आवेग नहीं मिला है, खासकर उपभोक्ताओं के लिए। Google और कांटर इंडिया एनालिसिस फर्म के देश में केंद्रित एक पहला सर्वेक्षण बताता है कि 60% तक उत्तरदाताओं को एआई के किसी भी उपकरण या आवेदन से परिचित नहीं है, और केवल 31% ने किसी भी जनरेटिव एआई के साथ अनुभव किया है: इसके नमूने के आकार में 18 भारतीय शहरों में 8,000 लोग शामिल हैं, और यह सर्वेक्षण मार्च में समाप्त हुआ है।
खोसला का मानना है कि यह उपकरणों की प्रासंगिकता भी है। “हमारे मॉडल अब मल्टीमॉडल, बहुभाषी हैं और कई एक्सेस पॉइंट हैं। वे कुछ तक सीमित नहीं हैं, चाहे वह भाषा, दृश्य, आवाज या पाठ हो,” वे कहते हैं। ऐसी उम्मीद है कि एंड्रॉइड फोन निर्माताओं सहित पारिस्थितिकी तंत्र भागीदारों, उपयोगकर्ताओं के लिए अधिक दृश्यता, गोद लेने और शिक्षा प्रदान करने में मदद करता है।
खोसला कहते हैं, “लोगों के जीवन में महत्वपूर्ण प्रासंगिकता लाना महत्वपूर्ण है। आप इसे एक्सेस कर सकते हैं, लेकिन इसमें अंतर नहीं है, यह उस पर वापस नहीं आएगा।”
Google-Kantar रिपोर्ट में एक उज्जवल पक्ष है, जिसमें सुझाव है कि 75%उत्तरदाताओं ने “ग्रोथ कोलाबोरेटर” को अपनाने के लिए तैयार किया, ताकि उन्हें उत्पादकता (72%) बढ़ाने में मदद मिल सके, रचनात्मकता (77%) में सुधार हो और घर और काम पर अपनी दिनचर्या में बेहतर (73%) संवाद किया जा सके।
Google DeepMind द्वारा विकसित मल्टीमॉडल बड़े भाषा मॉडल के एक परिवार द्वारा रेखांकित Google के मिथुन सहायक के उपयोगकर्ताओं के लिए विशिष्ट, अध्ययन से पता चलता है कि उत्पादकता में सुधार करने के लिए प्रासंगिकता है (93%मिथुन उपयोगकर्ताओं को बहुत कुछ इंगित करता है), रचनात्मकता (85%) और पते की जटिलता (80%) के साथ विशेषज्ञ गाइड या निर्णय लेने में मदद करने के लिए मदद करता है।
ये संख्याएं एआई के लिए एक संभावित हेड स्पेस को रेखांकित करती हैं, अंततः लोगों के लिए एक नियमित उपकरण बन जाती है, और देश में व्यापार को अपनाने के विपरीत चिह्नित होती है। एआई कंपनियों के लिए मुद्रा के दो अलग -अलग पक्ष, एक खोए हुए समय में से एक और दुनिया के सबसे बड़े बाजारों में से एक में संभावित, यहां तक कि जब वे हाल के महीनों में एक निरंतर गति से नए मॉडल और कार्यक्षमता जारी कर रहे हैं।
पिछले साल नवंबर में एक रिपोर्ट में, बोस्टन कंसल्टिंग ग्रुप ने संकेत दिया था कि 30% भारतीय कंपनियां और कंपनियां किसी तरह से एआई का लाभ उठा रही हैं, जो 26% वैश्विक औसत से अधिक है, जो फिनटेक, सॉफ्टवेयर और बैंकिंग इस आवेग का नेतृत्व करते हैं।
कैनवा विजुअल कम्युनिकेशंस प्लेटफॉर्म, विजुअल इकोनॉमी की अपनी नवीनतम रिपोर्ट में इंगित करता है कि भारत में सर्वेक्षण की गई 10 कंपनियों और कंपनियों में से 9 सामग्री और दृश्य संचार कार्यों के निर्माण के लिए एआई की ओर पहला कदम उठाने लगे हैं।