MiniMax M3 AI मॉडेल नवीन ओपन अल्टरनेटिव्ह शेक्स अप GPT-5.5

1 जून 2026 रोजी लाँच केलेले MiniMax M3 AI मॉडेल, कृत्रिम बुद्धिमत्ता लँडस्केपमध्ये भूकंपीय बदल दर्शवते. हा सखोल संशोधन अहवाल OpenAI च्या GPT-5.5 आणि Google च्या Gemini 3.1 Pro सारख्या बंद-स्रोत टायटन्सला आव्हान देण्यासाठी डिझाइन केलेल्या मॉडेलचे आर्किटेक्चरल प्रगती, अनुभवजन्य बेंचमार्क आणि व्यापक उद्योग परिणामांचे खंडित करतो.
MiniMax ने M3 हे त्याचे फ्लॅगशिप आर्टिफिशियल इंटेलिजन्स मॉडेल म्हणून सादर केले, विशेषत: स्वायत्त कोडिंग एजंट्स आणि स्वयंचलित एंटरप्राइझ वर्कफ्लोमध्ये विस्ताराला लक्ष्य केले. ही घोषणा कंपनीसाठी अत्यंत धोरणात्मक टप्प्यावर आली आहे: MiniMax ने अधिकृतपणे शांघायच्या टेक-हेवी STAR मार्केटवर इनिशियल पब्लिक ऑफरिंग (IPO) साठी तयारी सुरू केल्यानंतर, हाँगकाँगमध्ये नियोजित दुहेरी सूचीसह हे पहिले मोठे उत्पादन आहे.
M3 चे मार्केट पोझिशनिंग आश्चर्यकारकपणे आक्रमक आहे. ओपन-वेट रिलीझ प्लॅन अंतर्गत मोठ्या संदर्भ विंडोसह फ्रंटियर-लेव्हल कोडिंग कार्यप्रदर्शन आणि मूळ मल्टीमोडॅलिटी एकत्र करून, MiniMax थेट सिलिकॉन व्हॅलीच्या बंद AI लॅबच्या प्रबळ आर्थिक मॉडेलला आव्हान देत आहे.
तांत्रिक नवोपक्रम: मिनीमॅक्स स्पार्स अटेंशन (MSA)
M3 मॉडेलचे आर्किटेक्चरल हायलाइट म्हणजे MiniMax Sparse Attention (MSA). पारंपारिक ट्रान्सफॉर्मर मॉडेल “पूर्ण लक्ष” वापरतात, जेथे प्रत्येक टोकन (शब्द किंवा पिक्सेल तुकडा) इतर प्रत्येक टोकनशी तुलना केली जाते. हे चतुर्भुज कंप्यूट एक्स्प्लोजन ($O(N^2)$) बनवते जे मोठ्या कॉन्टेक्स्ट विंडोला झपाट्याने महाग आणि हळू बनवते.
MSA की-व्हॅल्यू (KV) ब्लॉक निवड वापरून प्री-फिल्टरिंग स्टेज सादर करून गणितीय प्रतिमान बदलते. संपूर्ण क्रम स्कॅन करण्याऐवजी, प्रत्येक टोकन केवळ अत्यंत संबंधित, निवडलेल्या उपसंचासाठी उपस्थित असतो.
या आर्किटेक्चरल बदलामुळे आश्चर्यकारक कार्यक्षमता नफा मिळतो, विशेषत: मॉडेलच्या कमाल क्षमतेवर:
- कठोर खर्चात कपात: MSA अनुमान गणना आवश्यकता 95% पर्यंत कमी करते, प्रति-टोकन गणना मागील पिढीच्या (M2.7) फक्त 1/20 पर्यंत खाली आणते.
- स्पीड बेंचमार्क: मिनीमॅक्स प्रीफिल फेज दरम्यान 9x स्पीडअपचा अहवाल देतो (प्रॉम्प्ट वाचणे आणि त्यावर प्रक्रिया करणे) आणि डीकोडिंग टप्प्यात 15x स्पीडअप.
- संदर्भ विंडो विस्तार: M3 एकाच वेळी 1 दशलक्ष टोकन डेटावर प्रक्रिया करते, M2.7 च्या 200,000-टोकन मर्यादेपेक्षा पाच पट विस्तार. हे संपूर्ण मध्यम आकाराच्या कोडबेस, मोठ्या कायदेशीर फायली, किंवा परस्परसंवाद लॉगच्या तासांना सक्रिय मेमरीमध्ये मूळपणे बसण्याची परवानगी देते.
अनुभवजन्य कामगिरी आणि बेंचमार्क
टेक क्षेत्रातील तरंगांना कारणीभूत असणारा मथळा दावा म्हणजे M3 ची SWE-Bench Pro वरील कामगिरी, एक बेंचमार्क चाचणी रिअल-वर्ल्ड, लाँग-हॉरिझन सॉफ्टवेअर अभियांत्रिकी समस्या. या मूल्यमापनांमध्ये, M3 ने OpenAI च्या GPT-5.5 आणि Google च्या Gemini 3.1 Pro ला मागे टाकत 59.0% गुण मिळवले. M3 ने SWE-Bench Pro वर विजयाचा दावा केला आहे आणि टर्मिनल-बेंच 2.1 (एजंटिक कमांड-लाइन टास्क) वर 66.0% ने जोरदार मजल मारली आहे, तर ते सर्व बुद्धिमत्ता श्रेणींमध्ये क्लीन स्वीप दर्शवत नाही:
- द रिझनिंग गॅप: पोस्टट्रेनबेंचवर, M3 ने 0.37 स्कोअर केला, क्लॉड ओपस 4.7 (0.42) आणि GPT-5.5 (0.39) च्या मागे आहे.
- अमूर्त संज्ञानात्मक कमजोरी: ऐतिहासिकदृष्ट्या, मिनीमॅक्स कुटुंबाने अमूर्त, द्रव तर्काशी संघर्ष केला आहे. 2026 च्या सुरुवातीच्या ARC-AGI-2 (ॲबस्ट्रॅक्शन अँड रीझनिंग कॉर्पस) बक्षीसावरील चाचणीने कमी एकल-अंकी परिणाम दिले, जे दर्शविते की M3 ची ताकद सामान्यीकृत तात्विक विचारांच्या ऐवजी प्रोग्रामिंग आणि ब्राउझिंग सारख्या ठोस, संरचित वातावरणाभोवती अत्यंत विशेष आहे.
स्वायत्त क्षमता आणि मूळ बहुविधता
मागील मॉडेल्सच्या विपरीत जे मजकूर आणि व्हिजन सिस्टमला प्रशिक्षणानंतर एकत्र करतात, M3 मूळतः मल्टीमोडल आहे. यात “चरण 0” वरून मजकूर, प्रतिमा आणि व्हिडिओवर इंटरलीव्ह प्रशिक्षण घेण्यात आले, त्याच अर्थपूर्ण जागेत वेगवेगळ्या डेटा पद्धतींचे सखोलपणे विलीनीकरण.
हे मूळ संगणक वापरण्यास सक्षम करते, AI ला भौतिक डेस्कटॉपशी संवाद साधण्याची परवानगी देते. तैनाती चाचण्यांमध्ये, M3 ने स्थानिक ERP क्लायंट ऍप्लिकेशन उघडले आणि बॅच इनव्हॉइस नोंदी स्वायत्तपणे हाताळल्या.
शिवाय, MiniMax ने M3 चे एजंटिक स्टॅमिना दोन ताण चाचण्यांद्वारे प्रदर्शित केले:
- शैक्षणिक पेपर प्रतिकृती: केवळ एक कार्य वर्णन आणि मूल्यमापन स्क्रिप्ट दिल्यास, M3 ने ICLR 2025 उत्कृष्ट संशोधन पेपर पुनरुत्पादित करण्यासाठी 12 तास स्वतंत्रपणे काम केले, 18 कोड कमिट पुश केले आणि मानवी हस्तक्षेपाशिवाय 23 प्रायोगिक चार्ट तयार केले.
- CUDA कर्नल ऑप्टिमायझेशन: NVIDIA च्या हॉपर आर्किटेक्चरवर चालणारे सॉफ्टवेअर ऑप्टिमायझेशनसह कार्य केले गेले, M3 ने स्वतंत्रपणे कोडच्या सहा पुनरावृत्ती फेरी इंजिनियर केल्या. याने हार्डवेअर पीक युटिलायझेशनला तुटलेल्या 7.6% स्केलेटन कोडवरून 71.3% हार्डवेअर युटिलायझेशन वाढवले, 9.4x एक्झिक्यूशन स्पीडअप मिळवून.
MiniMax ने लाँचला अत्यंत विस्कळीत किंमत मॉडेलसह जोडले आहे. मानक दरांवर, M3 API $0.60 प्रति दशलक्ष इनपुट टोकन आणि $2.40 प्रति दशलक्ष आउटपुट टोकन सूचीबद्ध आहे. 1 जून लाँच करण्यासाठी, MiniMax ने पहिल्या आठवड्यात ($0.30 इनपुट / $1.20 आउटपुट) यामध्ये 50% ने घट केली.
यामुळे GPT-5.5 किंवा क्लॉड ओपस सारख्या बंद सीमावर्ती दिग्गजांना चालवण्याची किंमत अंदाजे 1/15 व्या ते 1/25 व्या वर M3 ठेवते. महत्त्वाची गोष्ट म्हणजे, MiniMax लाँच झाल्यापासून 10 दिवसांच्या आत HuggingFace आणि GitHub वर ओपन वेट्स रिलीझ करण्यासाठी वचनबद्ध आहे, ज्यामुळे एंटरप्राइझ संघांना त्यांच्या खाजगी पायाभूत सुविधांवर संपूर्णपणे फ्रंटियर-क्लास कोडिंग मॉडेल होस्ट करण्याचा एक व्यवहार्य मार्ग मिळेल.
Comments are closed.