एआय सिस्टम स्वतःहून का शिकत नाहीत: नवीन संशोधन मानवासारखे उपाय सुचवते

By Marathi On Mar 29, 2026

जरी कृत्रिम बुद्धिमत्ता (AI) ने मोठ्या प्रमाणात क्षमता अनलॉक केली असली तरी, त्यात एक मूलभूत समस्या असू शकते. एकदा तैनात केल्यावर ते शिकणे थांबवतात. मुले सतत त्यांच्या सभोवतालच्या परिस्थितीशी जुळवून घेत आणि शिकत असताना, आधुनिक काळातील AI मॉडेल वेळेत गोठलेले दिसतात. परिस्थिती बदलते तेव्हा त्यांना पुन्हा प्रशिक्षण देण्यासाठी त्यांना अभियंत्यांच्या सैन्याची आवश्यकता असते हे वेगळे सांगण्याची गरज नाही. नवीन पेपरमध्ये, AI संशोधक मानव आणि प्राणी नैसर्गिकरित्या कसे शिकतात यावर आधारित एक मूलगामी उपाय देतात.

निष्कर्ष पेपरमधून आहेत, एआय सिस्टम का शिकत नाहीत आणि त्याबद्दल काय करावे: संज्ञानात्मक विज्ञानातून स्वायत्त शिक्षणावरील धडे (17 मार्च, 2026), इमॅन्युएल डुपॉक्स, यान लेकुन आणि जितेंद्र मलिक यांचे अनुक्रमे मेटा, NYU, UC बर्कले आणि École des Hautes Études en Sciences Sociales येथे FAIR शी संलग्न.

लहान मुले कशी शिकतात याचा विचार करा: ते सक्रियपणे एक्सप्लोर करतात, इतरांचे निरीक्षण करणे आणि स्वत: प्रयत्न करणे यांमध्ये अखंडपणे स्विच करतात आणि त्याच वेळी त्यांचे लक्ष काय आहे हे ठरवतात. जर काहीतरी कार्य करत नसेल तर ते लगेच समायोजित करतात. त्याउलट, आधुनिक एआय प्रणाली हे करण्यास अक्षम आहेत. त्याऐवजी, ते संशोधक 'MLOps' म्हणून काय वर्णन करतात यावर अवलंबून असतात – मोठ्या पाइपलाइन जिथे मानवी तज्ञ डेटा संकलित करतात, प्रशिक्षण मॉड्यूल डिझाइन करतात आणि नवीन परिस्थितींमध्ये अपयशी ठरल्यावर सुरवातीपासून मॉडेल पुन्हा तयार करतात.

पेपरच्या मते, यामुळे महत्त्वपूर्ण मर्यादा निर्माण होतात. सोप्या शब्दात, इंटरनेट डेटावर प्रशिक्षित AI सिस्टीम त्यांच्या प्रशिक्षणापेक्षा अत्यंत भिन्न असलेल्या वास्तविक-जगातील परिस्थितींना तोंड देत असताना अप्रत्याशितपणे कार्य करतात. ते बदलत्या वातावरणाशी जुळवून घेऊ शकत नाहीत किंवा स्वतःच्या चुकांमधून शिकू शकत नाहीत. या मॉडेल्समध्ये, विशेष म्हणजे, ते तैनात करण्यापूर्वी आणि पूर्णपणे मानवाद्वारे हाताळले जाण्यापूर्वी सर्व शिक्षण ऑफलाइन होते.

दोन प्रमुख शिक्षण पद्धती

पेपरने दोन मूलभूत शिक्षण पद्धती ओळखल्या ज्यांना एकत्र काम करणे आवश्यक आहे. सिस्टम ए – निरीक्षणातून शिकणे, ज्यामध्ये मानव जगाचे अंतर्गत मॉडेल कसे तयार करतात ते पाहणे आणि अंदाज लावणे समाविष्ट आहे. यामध्ये लहान मुलांपासून चेहरे ओळखण्यास शिकण्यापासून ते AI मधील आधुनिक स्व-पर्यवेक्षित शिक्षणापर्यंत सर्व गोष्टींचा समावेश आहे. सध्या, GPT चे टेक्स्ट प्रेडिक्शन किंवा प्रतिमांमधून शिकणारी व्हिजन मॉडेल्स या वर्गात मोडतात. त्यांची मुख्य ताकद अशी आहे की ते चांगले स्केल करतात आणि उपयुक्त नमुने शोधतात. दुसरीकडे, त्यांची कमकुवतता अशी आहे की ते कृतीपासून डिस्कनेक्ट झाले आहेत आणि सहसंबंध आणि कारणामध्ये फरक करू शकत नाहीत.

दरम्यान, सिस्टीम बी, ज्याचा अर्थ 'कृतीतून शिकणे' आहे, त्यात आपण चाचणी आणि त्रुटी, मजबुतीकरण शिक्षण आणि ध्येय-निर्देशित वर्तनाद्वारे कसे शिकतो याचा समावेश होतो. हे समजून घेण्यासाठी, वारंवार प्रयत्न करून चालायला शिकणाऱ्या मुलाचा विचार करा. येथे ताकद अशी आहे की ते वास्तविक परिणामांवर आधारित आहेत आणि नवीन उपाय शोधण्यात सक्षम आहेत. तथापि, दुर्बलता अशी आहे की ते अत्यंत नमुना-अकार्यक्षम आहेत आणि मोठ्या प्रमाणात परस्परसंवादाची आवश्यकता आहे.

जेव्हा जीवशास्त्राचा विचार केला जातो तेव्हा या प्रणाली नेहमी एकत्र काम करतात. सिस्टम ए, जी व्हिज्युअल प्रणाली आहे, संकुचित प्रतिनिधित्व शिकते ज्यामुळे मोटर नियोजन, सिस्टम बी, ट्रॅक्टेबल बनते. एखाद्याच्या कृतींमुळे माहितीपूर्ण डेटा व्युत्पन्न होतो ज्यामुळे त्यांचे आकलनक्षम मॉडेल सुधारतात. सध्याच्या AI सिस्टीम याला कठोर आणि हाताने डिझाइन केलेल्या एकत्रीकरणासह वेगळे डोमेन मानतात.

मेटा नियंत्रण

संशोधकांनी एक प्रणाली एम (मेटा-कंट्रोल) जोडण्याचा प्रस्ताव दिला आहे, जो एक संयोजक आहे जो गतिशीलपणे शिक्षण व्यवस्थापित करतो. सिस्टम एम मूलत: अंतर्गत सिग्नल जसे की अंदाज त्रुटी, अनिश्चितता आणि कार्य कार्यप्रदर्शनाचे निरीक्षण करते आणि मेटा-निर्णय करते. सोप्या शब्दात, सिस्टम एम समजून घेण्याचा प्रयत्न करते – मी कोणत्या डेटाकडे लक्ष द्यावे? मी एक्सप्लोर करावे की शोषण करावे? मी आत्ताच निरीक्षणातून किंवा कृतीतून शिकावे?

जेव्हा मनुष्य आणि प्राण्यांचा विचार केला जातो तेव्हा अशा प्रकारचे नियंत्रण नैसर्गिकरित्या होते. लहान मुले चेहरे आणि आवाजांवर लक्ष केंद्रित करतात, ज्यामुळे त्यांना लवकर शिकता येते. मुले जेव्हा अनिश्चित असतात तेव्हा शोध घेतात आणि जेव्हा त्यांना आत्मविश्वास असतो तेव्हा सराव करतात. झोपेतही, त्यांचे मेंदू ते शिकलेल्या गोष्टींवर प्रक्रिया करतात आणि ते मजबूत करतात. सिस्टम M ही क्षमता AI मध्ये आणेल. हे मानव सध्या करत असलेली कार्ये हाताळेल जसे की उपयुक्त डेटा निवडणे, शिकण्याच्या पायऱ्या समायोजित करणे आणि शिकण्याच्या पद्धतींमध्ये बदल करणे. यासह, निश्चित प्रशिक्षण प्रक्रियेऐवजी, एआय प्रणाली जे काही शिकले त्या आधारावर स्वतःचे रुपांतर करेल.

शिकणारा AI कसा तयार करायचा

पेपरमध्ये, संशोधकांनी बायोलॉजी – विकासात्मक टाइमस्केल आणि उत्क्रांती टाइमस्केल – दोन-टाइमस्केल दृष्टिकोनासह स्वायत्त शिक्षण प्रणाली तयार करण्याचा प्रस्ताव दिला आहे. विकासात्मक टाइमस्केलवर, एआय एजंट त्याच्या जीवनकाळात शिकतो, वातावरणाशी परस्परसंवादाद्वारे सिस्टम A आणि B अद्यतनित करतो, हे सर्व एका निश्चित सिस्टम M द्वारे आयोजित केले जाते.

उत्क्रांतीच्या टाइमस्केलवर, सिस्टीम एम स्वतः लाखो सिम्युलेटेड जीवनकालांमध्ये ऑप्टिमाइझ केले जाते. येथील फिटनेस फंक्शन एजंटना पुरस्कृत करते जे विविध आणि अप्रत्याशित वातावरणात जलद आणि मजबूतपणे शिकतात.

संशोधकांच्या मते, यासाठी संपूर्ण शिक्षण जीवनचक्रांद्वारे मोठ्या संख्येने सिम्युलेटेड एजंट्स चालवणे आवश्यक आहे, जे संगणकीयदृष्ट्या मागणीचे असेल परंतु परिवर्तनशील असू शकते. सोप्या भाषेत सांगायचे तर, ज्याप्रमाणे उत्क्रांतीने शेकडो वर्षांपासून मानवी शिकण्याच्या प्रवृत्तीला आकार दिला, त्याचप्रमाणे प्रभावी मेटा-नियंत्रण धोरणे शोधण्यासाठी आम्ही उत्क्रांतीवादी अल्गोरिदम वापरू शकतो.

हा फरक का पडतो?

हे महत्त्वाचे आहे कारण वर्तमान AI अयशस्वी होत आहे जेव्हा नियंत्रित वातावरणाबाहेर तैनात केले जाते, कारण ते परिस्थितीशी जुळवून घेण्यास असमर्थ असतात. स्वायत्त शिक्षणामुळे अनुभवातून सुधारणारे यंत्रमानव, अनपेक्षित परिस्थिती हाताळणाऱ्या AI प्रणाली आणि माणसांप्रमाणे सतत शिकणाऱ्या मॉडेल्सना अनुमती मिळेल.

संशोधकांच्या मते, आव्हाने लक्षणीय आहेत, कारण वास्तववादी भौतिकशास्त्र आणि सामाजिक गतिशीलतेसह रिअल-टाइम सिम्युलेटरपेक्षा वेगवान, शिकण्याच्या क्षमतेची चाचणी करणाऱ्या नवीन मूल्यांकन पद्धती आणि अभूतपूर्व स्तरांवर द्विस्तरीय ऑप्टिमायझेशनसाठी उपायांची आवश्यकता असेल.

तथापि, नैतिक चिंता देखील आहेत, कारण AI प्रणाली ज्या स्वतः शिकतात आणि त्यांच्याशी जुळवून घेतात त्या अनपेक्षित मार्गांनी वागू शकतात, ज्यामुळे सुरक्षितता आणि मानवी मूल्यांशी संरेखन बद्दल प्रश्न उद्भवू शकतात. संशोधकांनी या जोखमींची नोंद केली परंतु असा युक्तिवाद केला की स्वायत्त शिक्षणाचा अभ्यास करणे हे केवळ चांगले एआय तयार करण्यासाठीच नाही तर मानवी बुद्धिमत्ता अधिक चांगल्या प्रकारे समजून घेणे देखील महत्त्वाचे आहे.