जेमिनी 3 वि जेमिनी 3 प्रो वि जेमिनी 3 डीपथिंक: Google च्या नवीनतम एआय मॉडेल्ससाठी एक द्रुत मार्गदर्शक

Gemini 3 vs Gemini 3 Pro vs Gemini 3 DeepThink: Gemini 3 चे रोलआउट, Google चे नवीनतम लार्ज लँग्वेज मॉडेल (LLM), अलीकडच्या काही महिन्यांत टेक जायंटचे सर्वात मजबूत AI पदार्पण असल्याचे दिसते कारण त्याला वापरकर्ते आणि विकसकांकडून सकारात्मक अभिप्राय मिळाला आहे.
प्रारंभिक पुनरावलोकने सुचवतात की मिथुन 3 हे अत्यंत सक्षम पायाभूत AI मॉडेल आहे, विशेषत: जेव्हा तर्क-जड कार्ये हाताळण्यासाठी येतो. हे मॉडेल 18 नोव्हेंबर रोजी पाठवण्यात आले होते, Google ने त्याच्या आगमनाची जाहिरात 'बुद्धिमत्तेचे नवीन युग' म्हणून केली होती.
मिथुन 3 पूर्वीच्या मॉडेलच्या तुलनेत अधिक जटिल प्रश्नांची उत्तम उत्तरे देण्यासाठी डिझाइन केलेले आहे. हे Google ने 'वाइब-कोडिंग'साठी तयार केलेले सर्वोत्कृष्ट मॉडेल असल्याचेही म्हटले जाते, ही विवादास्पद प्रथा आहे जिथे वापरकर्ते कोड व्युत्पन्न करण्यासाठी आणि सॉफ्टवेअर तयार करण्यासाठी AI साधनांवर अवलंबून असतात.
Google च्या मते, जेमिनी 3 सह त्याची प्रगती अनेक बेंचमार्क चाचण्यांमध्ये मॉडेलच्या कामगिरीमध्ये दिसून येते. कंपनीने दावा केला आहे की जेमिनी 3 ने प्रत्येक AI बेंचमार्कवर आपल्या पूर्ववर्तीपेक्षा जास्त कामगिरी केली आहे, LM एरिना लीडरबोर्डमध्ये अव्वल स्थान मिळवले आहे तसेच ह्युमॅनिटीच्या शेवटच्या परीक्षेत आणि GPQA डायमंडमध्ये सर्वोच्च गुण मिळवले आहेत.
तथापि, सार्वजनिक बेंचमार्कवर वास्तविक-जगातील AI कार्यप्रदर्शनाचे अविश्वसनीय निर्देशक म्हणून टीका केली गेली आहे कारण ते खेळण्यास सोपे असू शकतात. उदाहरणार्थ, प्रसिद्ध AI संशोधक आंद्रेज करपथी यांनी निदर्शनास आणून दिले की जेमिनी 3 ने 2025 आहे यावर विश्वास ठेवण्यास नकार दिला कारण त्याच्या पूर्व-प्रशिक्षण डेटामध्ये फक्त 2024 पर्यंतची माहिती समाविष्ट आहे. परंतु त्यांनी हे देखील मान्य केले की मिथुन 3 बद्दलची त्यांची सुरुवातीची छाप सकारात्मक होती.
मी काल लवकर प्रवेशाद्वारे मिथुन 3 सह खेळलो. थोडे विचार –
प्रथम मी सामान्यत: सार्वजनिक बेंचमार्कसह सावधगिरी बाळगण्याचे आवाहन करतो कारण imo ते गेम करणे शक्य आहे. हे संघाच्या शिस्त आणि आत्मसंयमावर येते (ज्याला अन्यथा जोरदार प्रोत्साहन दिले जाते) ते…
— आंद्रेज करपथी (@karpathy) 18 नोव्हेंबर 2025
पुढील काही आठवड्यांमध्ये फीडबॅक येत राहिल्याने, जेमिनी 3 मॉडेल्सच्या फॅमिली आणि त्या प्रत्येकाने काय ऑफर केले आहे ते जवळून पाहू.
मिथुन 3
मिथुन 3 मल्टिमोडल तर्क क्षमता आहे असे म्हटले जाते, याचा अर्थ असा की ते तर्क क्षमतांना दृष्टी आणि अवकाशीय समज तसेच बहुभाषिक कौशल्ये आणि एक दशलक्ष-टोकन संदर्भ विंडो, वापरकर्त्यांना लांब प्रश्नांसह जटिल आणि सूक्ष्म प्रश्न विचारण्याची परवानगी देते.
विकसकांसाठी, जेमिनी 3 अधिक समृद्ध, अधिक परस्परसंवादी वेब UI रेंडर करण्यासाठी जटिल सूचना आणि सूचना हाताळण्यास सक्षम आहे. Google च्या मते, जेमिनी 3 शून्य-शॉट जनरेशनमध्ये 'अपवादात्मक' आहे याचा अर्थ असा आहे की अशा घटकांवर स्पष्टपणे प्रशिक्षण न घेता ते सॉफ्टवेअर घटक तयार करू शकते.
या जाहिरातीच्या खाली कथा सुरू आहे
वापराच्या बाबतीत, Google ने म्हटले आहे की वापरकर्ते, उदाहरणार्थ, Gemini 3 ला वेगवेगळ्या भाषांमधील हस्तलिखित पाककृतींचा उलगडा करण्यासाठी आणि शेअर करण्यायोग्य कौटुंबिक कूकबुकमध्ये भाषांतर करण्यास सांगू शकतात. “हे तुमच्या पिकलबॉल सामन्याच्या व्हिडिओंचे विश्लेषण देखील करू शकते, तुम्ही कोणत्या भागात सुधारणा करू शकता ते ओळखू शकते आणि एकूण फॉर्म सुधारण्यासाठी प्रशिक्षण योजना तयार करू शकते,” कंपनीने म्हटले आहे.
गुगलच्या म्हणण्यानुसार, मिथुन 3 च्या अनेक सुरक्षितता चाचण्या करण्यात आल्या आहेत ज्यायोगे गुगलचा त्रास कमी करण्यासाठी आणि दुर्भावनापूर्ण प्रॉम्प्ट इंजेक्शन हल्ल्यांचा प्रतिकार सुधारण्यासाठी.
बेंचमार्क आघाडीवर, Gemini 3 ने प्रभावी 1487 Elo स्कोअर करून WebDev Arena लीडरबोर्डमध्ये अव्वल स्थान पटकावले. हे टर्मिनल-बेंच 2.0 वर देखील 54.2 टक्के गुण मिळवते, जे टर्मिनलद्वारे संगणक ऑपरेट करण्यासाठी मॉडेलच्या टूल वापरण्याच्या क्षमतेची चाचणी करते. याने SWE-बेंच व्हेरिफाईड (76.2 टक्के) वर जेमिनी 2.5 प्रो ला मागे टाकले, जो कोडिंग एजंट्स मोजणारा बेंचमार्क आहे.
मॉडेलने पुढे Vending-Bench 2 लीडरबोर्डमध्ये अव्वल स्थान मिळवले, जे सिम्युलेटेड वेंडिंग मशीन व्यवसाय व्यवस्थापित करून दीर्घ क्षितिजाच्या नियोजनाची चाचणी करते.
मिथुन 3 प्रो
“जेमिनी 3 प्रो इतर फ्रंटियर मॉडेल्सच्या तुलनेत लक्षणीय उच्च परतावा व्युत्पन्न करण्यासाठी दीर्घ-क्षितिजाचे उत्तम नियोजन दाखवते,” Google ने म्हटले आहे.
या जाहिरातीच्या खाली कथा सुरू आहे
त्याचे प्रतिसाद स्मार्ट, संक्षिप्त आणि थेट आहेत. “हे एक खरे विचार भागीदार म्हणून काम करते जे तुम्हाला माहिती समजून घेण्याचे आणि स्वतःला व्यक्त करण्याचे नवीन मार्ग देते, उच्च-विश्वस्त व्हिज्युअलायझेशनसाठी कोड तयार करण्यापासून ते सर्जनशील विचारमंथनापर्यंत घन वैज्ञानिक संकल्पनांचे भाषांतर करून,” कंपनी जोडते.
Geminin 3 Pro ने प्रत्येक प्रमुख AI बेंचमार्कवर 2.5 Pro ला मागे टाकले आहे. तो 1501 Elo च्या यशस्वी स्कोअरसह LMArena लीडरबोर्डमध्ये अव्वल आहे. ह्युमॅनिटीच्या शेवटच्या परीक्षेत (कोणत्याही साधनांचा वापर न करता 37.5 टक्के) आणि GPQA डायमंड (91.9 टक्के) वर तिला सर्वोच्च गुण मिळाले.
मिथुन 3 प्रो विज्ञान आणि गणितासारख्या विषयांच्या विस्तृत श्रेणीतील जटिल समस्यांचे निराकरण करण्यात अत्यंत सक्षम असल्याचे म्हटले जाते. हे सेट अ MathArena Apex वर नवीन उच्च स्कोअर (23.4 टक्के), गणितावरील फ्रंटियर मॉडेल्सचे मूल्यांकन करण्यासाठी बेंचमार्क. मॉडेलने MMMU-Pro वर 81 टक्के आणि व्हिडीओ-MMMU वर 87.6 टक्के गुण मिळविल्यामुळे त्याचे मल्टीमोडल तर्क मजकुराच्या पलीकडे विस्तारित आहे.
जेमिनी 3 प्रो चे प्रतिसाद देखील वास्तविकदृष्ट्या अचूक असण्याची शक्यता जास्त आहे कारण त्याने SimpleQA सत्यापित वर 72.1 टक्के गुण मिळवले आहेत.
या जाहिरातीच्या खाली कथा सुरू आहे
मिथुन 3 सखोल विचार करा
जेमिनी 3 डीप थिंक हा एक वर्धित तर्क पद्धती आहे जो वापरकर्त्यांना अधिक जटिल समस्यांचे निराकरण करण्यात मदत करण्यासाठी जेमिनी 3 च्या मल्टीमोडल तर्क क्षमतांना आणखी पुढे ढकलतो.
चाचणीमध्ये, Gemini 3 Deep Think ने Humanity's Last Exam (टूल्स न वापरता 41.0 टक्के) आणि GPQA डायमंड (93.8%) वर जेमिनी 3 प्रो च्या कामगिरीला मागे टाकले. याने ARC-AGI-2 (कोड अंमलबजावणीसह, ARC प्राईझ व्हेरिफाईड) वर 45.1 टक्के मिळवले, नवीन आव्हाने सोडवण्याची क्षमता दाखवून दिली.
तथापि, Google ने सांगितले की जेमिनी 3 डीप थिंक मोडचे अद्याप सुरक्षिततेचे मूल्यांकन केले जात आहे आणि येत्या आठवड्यात सुरक्षा परीक्षकांकडून इनपुट एकत्रित केल्यानंतर ते Google AI अल्ट्रा सदस्यांना उपलब्ध करून दिले जाईल. कंपनीने असेही म्हटले आहे की ते लवकरच जेमिनी 3 मालिकेत अतिरिक्त मॉडेल्स सोडण्याची योजना आखत आहेत.
Comments are closed.