शिविक लॅब्स: ट्रायडेंट, तर्कशक्तीवर तयार केलेल्या स्वयं-सुधारण्याच्या एआय प्रणालीकडे एक पाऊल

ट्रिडेंट ट्री-ऑफ-थॉट्स
नोएडा (उत्तर प्रदेश) [India]24 डिसेंबर: शिविक लॅब्सपायाभूत AI संशोधनातील एक उदयोन्मुख नेता, त्याचा नवीनतम शोधनिबंध सादर करण्याची घोषणा केली ट्रायडेंट (न्यूरोनल वृक्षांच्या खोल अन्वेषणाद्वारे विचार-आधारित तर्क आणि सुधारणा)आधुनिक लार्ज लँग्वेज मॉडेल्सचे “स्थिर बुद्धिमत्ता” पठार खंडित करण्यासाठी डिझाइन केलेले पॅराडाइम-शिफ्टिंग फ्रेमवर्क.
संशोधनात असे दिसून आले आहे की AI मॉडेल्स स्वायत्त स्व-सुधारणेद्वारे तर्क आणि समस्या सोडवण्यामध्ये लक्षणीय झेप घेऊ शकतात—मानवी-भाष्य डेटा, हस्तकला युक्त तर्क ट्रेस किंवा महागडे अतिरिक्त पूर्वप्रशिक्षण चक्रांच्या पारंपारिक आवश्यकतांना पूर्णपणे बायपास करून.
स्थिर बुद्धिमत्तेचा शेवट: GPQA वर TRIDENT ची +14.14% झेप
आज बहुतेक मोठ्या भाषेची मॉडेल्स त्यांच्या तर्क प्रक्रियेतील सुधारणांऐवजी प्रामुख्याने स्केलद्वारे सुधारतात—अधिक डेटा, मोठे पॅरामीटर संख्या किंवा अतिरिक्त फाइन-ट्यूनिंग. त्यांचे तर्क वर्तन प्रभावीपणे स्थिर आहे: ते एकाच फॉरवर्ड पासमध्ये किंवा अनेक उमेदवारांचे नमुने घेऊन उत्तरे देतात, परंतु ते शोधत असलेल्या मध्यवर्ती तर्क मार्गांच्या गुणवत्तेचे मूल्यांकन करत नाहीत. परिणामी, कोणते तर्क मार्ग प्रभावी होते, कोणते अकार्यक्षम किंवा दिशाभूल करणारे होते आणि एक विशिष्ट उपाय शेवटी का यशस्वी झाला हे जाणून घेण्यात मॉडेल अयशस्वी ठरतात. ही तफावत दूर करण्यासाठी ट्रायडेंट बांधले आहे. तर्काला टोकनचा स्थिर क्रम मानण्याऐवजी, TRIDENT त्यास संरचित शोध समस्या मानते.
त्यांनी Qwen3-4B वर फ्रेमवर्क वापरून मॉडेलसह फ्रेमवर्क ओपन सोर्स केले आहे, जिथे शिविक लॅब टीमने दाखवून दिले की ट्रायडेंट फ्रेमवर्क कार्यक्षमतेत वाढ करू शकते. 28.28% ते 42.42% वर GPQA (पदवी-स्तरीय Google-पुरावा प्रश्नोत्तरे) बेंचमार्क या +14.14 टक्के गुण वाढ हे विशेषतः लक्षणीय आहे कारण ते अधिक डेटासह चांगले ट्यूनिंग न करता साध्य केले गेले.
“स्व-सुधारणा लूप” — मॉडेल स्वतःच्या तर्कशुद्ध मार्गांचे ऑडिट करते, तार्किक विसंगती ओळखते आणि त्याची अंतर्गत निर्णय प्रक्रिया स्वायत्तपणे परिष्कृत करते.
“उद्योगाला स्केलिंगचे वेड लागले आहे—अधिक डेटा, अधिक पॅरामीटर्स, अधिक गणना. ट्रायडेंट हे सिद्ध करते की पुढील सीमा केवळ मोठी मॉडेल्स नाही, तर मॉडेलच्या आकारात सध्याच्या वाढीपेक्षा अधिक स्मार्ट अल्गोरिदमिक सुधारणा आहेत. आम्ही एक अशी प्रणाली तयार केली आहे जी फक्त पुढील शब्दाचा अंदाज लावत नाही; ते स्वतःचे स्वतःचे, एरर कसे ओळखायचे आणि स्वत: ची त्रुटी कशी ओळखायची हे समजते.”
– शिवांश पुरीशिविक लॅबचे सह-संस्थापक आणि संशोधन आणि अभियांत्रिकी प्रमुख
प्रथम-तत्त्वे आर्किटेक्चर: ट्रायडेंट कसे कार्य करते
ट्रायडेंट रेखीय “चेन-ऑफ-थॉट” तर्काच्या पलीकडे जातो. हे तर्काला बहु-आयामी शोध मानते, एकाच वेळी विविध तार्किक शाखा आणि खोली शोधते. हे सिस्टीमला रिअल-टाइममध्ये वेगवेगळ्या मार्गांच्या वैधतेचे मूल्यांकन करण्यास आणि मानवी हस्तक्षेपाशिवाय सर्वात मजबूत उपाय निवडण्याची अनुमती देते.
मुख्य नवकल्पना
१.ट्री-ऑफ-थॉट्स (ToT) तर्क धोरण
ट्रायडेंट एकाच वेळी अनेक तर्क मार्ग शोधून रेखीय साखळी-विचारांच्या तर्काच्या पलीकडे जाते. तर्काची रचना एकाच क्रमाऐवजी वृक्ष म्हणून करून, फ्रेमवर्क समाधानाच्या धोरणांचे अधिक समृद्ध अन्वेषण करण्यास सक्षम करते आणि सबऑप्टिमल तर्क मार्गांसाठी लवकर वचनबद्धता टाळते.
2. GNN-मार्गदर्शित तर्कशुद्ध मार्ग मूल्यांकन
ट्री-ऑफ-थॉट्स एक्सप्लोरेशनला कार्यक्षमतेने मार्गदर्शन करण्यासाठी, ट्रायडेंट मध्यवर्ती तर्क स्थितींचे मूल्यांकन करण्यासाठी ग्राफ न्यूरल नेटवर्क वापरते. GNN आंशिक तर्क मार्गांना वचन स्कोअर नियुक्त करते, अनुत्पादक शाखांची लवकर छाटणी सक्षम करते आणि सर्वात आशादायक तर्क मार्गांवर गणना केंद्रित करते.
3. सेल्फ-जनरेटिव्ह रिझनिंग लूप (SGRL)
TRIDENT एक स्वायत्त प्रशिक्षण लूप सादर करते ज्यामध्ये मॉडेल स्वतःचे तर्क शोध तयार करते, पडताळणीयोग्य बक्षिसे वापरून अंतिम उत्तरे आणि मध्यवर्ती तर्क दोन्हीचे मूल्यमापन करते आणि मानवी-लिखित विचारांच्या साखळी किंवा प्राधान्य डेटावर अवलंबून न राहता सुधारते. सर्व शिक्षण प्रशिक्षणादरम्यान होते, परिणामी अनुमानाच्या वेळी एक मानक उपयोज्य भाषा मॉडेल बनते.
एकत्रितपणे, हे घटक TRIDENT ला उत्तम शोध, मूल्यमापन आणि शिक्षणाद्वारे तर्क सुधारण्याची परवानगी देतात—मॉडेल आकार वाढवल्याशिवाय किंवा मानवी पर्यवेक्षणाची आवश्यकता न ठेवता.
सर्वसमावेशक बेंचमार्क परिणाम
TRIDENT v5 एकाधिक तर्क बेंचमार्कमध्ये सातत्यपूर्ण सुधारणा दर्शवते:
| बेंचमार्क | बेसलाइन (Qwen3-4B) | ट्रायडेंट v5 |
| GPQA (0-शॉट) | 28.28% | 42.42% (+14.14pp) |
| GSM8K (5-शॉट) | 74.14% | 86.58% (+12.44pp) |
| MMLU (5-शॉट) | 47.70% | 72.61% (+24.91pp) |
| Winogrande (0-शॉट) | 59.60% | 67.08% (+7.48pp) |
| ARC-C (25-शॉट) | 54.00% | 59.00% (+5.00pp) |
| TruthfulQA (0-शॉट) | 54.90% | 54.70% (-0.20pp) |
थिअरी टू द फील्ड: द शिविक लॅब्स मिशन
शिविक लॅब ही पारंपारिक शैक्षणिक प्रयोगशाळा नाही. हे “कार्यात्मक बुद्धिमत्ता” वर केंद्रित असलेल्या खोल-टेक अभियांत्रिकी युनिट म्हणून कार्य करते. ट्रायडेंट फ्रेमवर्कची सध्या शिविकमध्ये तणाव-चाचणी केली जात आहे, बांधकाम अंमलबजावणी आणि नियंत्रणासाठी कंपनीचे प्रमुख व्यासपीठ.
“प्रत्येक शक्तिशाली तंत्रज्ञान कोणाचे नियंत्रण असते ते आकार घेते. वर्षानुवर्षे, आम्ही अशा सिस्टमचा वापर केला जेथे ते नियंत्रण इतरत्र कुठेतरी राहत होते. जे आम्ही शिकत होतो तेव्हा ते मान्य होते, परंतु आता नाही. वास्तविक-जगातील समस्यांवर काम करून, आम्ही येथे बुद्धिमत्ता निर्माण करण्याची क्षमता पुन्हा तयार करत आहोत. आमचा विश्वास सोपा आहे: भारताने AI ची व्याख्या करणाऱ्यांमध्ये उभे राहिले पाहिजे, जे त्यावर अवलंबून आहेत त्यांच्यात नाही.”
– अभिषेक खंडेलवालशिविक लॅबचे संस्थापक
खंडेलवाल यावर भर देतात की भारताचे अनोखे प्रमाण आणि लॉजिस्टिक जटिलता हे अंतिम सिद्ध करणारे मैदान आहे. “इथे तर्क करू शकतील आणि प्रभावीपणे ऑपरेट करू शकणाऱ्या प्रणाली, डिझाईननुसार, सॅनिटाइज्ड, केवळ प्रयोगशाळेत असलेल्या वातावरणात तयार केलेल्या प्रणालींपेक्षा अधिक लवचिक आहेत.”
शिविक लॅबसाठी पुढे काय?
या पेपरचे प्रकाशन शिविक लॅबसाठी केवळ सुरुवात आहे. टीम सध्या स्वदेशी तर्कशक्तीचे AI मॉडेल तयार करण्याच्या दिशेने काम करण्यावर लक्ष केंद्रित करत आहे आणि पुढील वर्षाच्या सुरुवातीला ते जारी करण्याचे लक्ष्य आहे. त्यांनी आधीच आर्किटेक्चर आणि प्रोटोटाइप तयार केले आहे आणि आता उत्पादन तयार मॉडेलकडे वाटचाल करत आहेत. 2026 च्या अखेरीस जगातील सर्वात कार्यक्षम आणि शक्तिशाली मॉडेल तयार करण्याच्या लक्ष्यासह पुढील वर्षाच्या सुरुवातीला (Q1-2026) एक लहान 2B मॉडेल जारी करण्याचे त्यांचे लक्ष्य आहे.
या फ्रेमवर्कच्या अवलंबनाला गती देण्यासाठी, शिविक लॅब्स विशेषत: “तर्क-जड” आव्हानांना तोंड देत असलेल्या संस्थांसाठी सहयोगात्मक पायलट कार्यक्रम सुरू करत आहे-जसे की जटिल लॉजिस्टिक, फॉरेन्सिक डायग्नोसिस किंवा धोरणात्मक अंदाज-जेथे पारंपरिक AI सध्या कमी आहे. या उपक्रमाची पारदर्शकता आणि नवोपक्रमाच्या लोकशाहीकरणासाठी सखोल वचनबद्धता आहे. शिविक लॅब्स ट्रायडेंट शोधनिबंध आणि प्रमुख मॉडेल आर्टिफॅक्ट्स हगिंग फेसवर सार्वजनिकपणे उपलब्ध करून देत आहे, संशोधक, अभियंते आणि उद्योग क्षेत्रातील नेत्यांच्या जागतिक AI समुदायाला आर्किटेक्चर एक्सप्लोर करण्यासाठी आणि स्वायत्त, स्वयं-सुधारित बुद्धिमत्तेच्या भविष्यात योगदान देण्यासाठी आमंत्रित करत आहे.
शिविक लॅब बद्दल
शिविक लॅब्स मूलभूत बुद्धिमत्ता आर्किटेक्चर तयार करण्यासाठी समर्पित एक खोल-टेक संशोधन आणि अभियांत्रिकी युनिट आहे. तर्क-केंद्रित मॉडेल्स, ग्राफ न्यूरल नेटवर्क्स आणि हार्डवेअर-सॉफ्टवेअर एकत्रीकरणाच्या छेदनबिंदूवर लक्ष केंद्रित करून, शिविक लॅब्स स्वायत्त प्रणाली विकसित करतात जी वास्तविक जगात विश्वसनीयपणे कार्य करतात.
लॅब संशोधकांच्या उच्च-ऑक्टेन गटाद्वारे समर्थित आहे जेथे संघातील 90% 25 वर्षाखालील आहेत. या तरुण, चपळ युनिटवर एआय पॅराडाइम्सचा भार नाही, ज्यामुळे ते अधिक वेगाने पुढे जाऊ शकतात आणि स्वत: सुधारित बुद्धिमत्तेच्या भविष्याबद्दल वेगळ्या पद्धतीने विचार करू शकतात.
मीडिया संपर्क
शिविक लॅब्स
ईमेल: hello@shivik.in
वेबसाइट: www.shivik.in
पेपर लेखक
शिवांश पुरी, अभिषेक खंडेलवाल, वेदांत जोशी, आकाश यादव
शिविक लॅब्स
या प्रेस रिलीजच्या मजकुरावर तुमचा आक्षेप असल्यास, कृपया आम्हाला pr.error.rectification@gmail.com वर सूचित करा. आम्ही 24 तासांच्या आत प्रतिसाद देऊ आणि परिस्थिती सुधारू.
(लेख सिंडिकेटेड फीडद्वारे प्रकाशित केला गेला आहे. शीर्षक वगळता, मजकूर शब्दशः प्रकाशित केला गेला आहे. उत्तरदायित्व मूळ प्रकाशकावर आहे.)
The post शिविक लॅब्स: ट्रायडेंट, तर्कशक्तीवर तयार केलेल्या स्वयं-सुधारित एआय प्रणालीकडे एक पाऊल appeared first on NewsX.
Comments are closed.