स्मार्ट, सुरक्षित आणि क्रांतिकारक बुद्धिमत्ता अनलॉक करणे

By Marathi On Sep 28, 2025

हायलाइट

स्वयं-सुधारित एआय मॉडेल सतत शिक्षण आणि अभिप्रायासह रिअल टाइममध्ये अनुकूलित करतात.
सील आणि प्रतिस्पर्धी फ्रेमवर्क स्मार्ट, सुरक्षित एआय प्रगती दर्शवितात.
नैतिक, सुरक्षित आणि कार्यक्षम वाढ स्वत: ची सुधारित एआय मॉडेल क्रांतिकारक बनवते.

कृत्रिम बुद्धिमत्तेतील सर्वात आकर्षक सीमांपैकी एक म्हणजे चळवळ स्वत: ची सुधारित एआय मॉडेल – ज्या सिस्टम फक्त चांगले सुरू होत नाहीत, त्या नंतर संपूर्ण पर्यवेक्षी प्रशिक्षण चक्राची आवश्यकता न घेता तैनात केल्यानंतर नंतर शिकतात, परिस्थितीशी जुळवून घेतात, विकसित करतात आणि सुधारित करतात. एआय समाजात अधिक सर्वव्यापी बनत असताना, विद्यमान मॉडेल, जसे की मोठ्या भाषेचे मॉडेल (एलएलएम), व्हिज्युअल मॉडेल्स आणि अशाच प्रकारे बहुतेकदा “शिळे” बनतात: त्यांना नवीनतम तथ्यांविषयी माहिती नसते, ते एखाद्या व्यक्तीच्या बदलत्या पसंतीशी जुळत नाहीत आणि जेव्हा वातावरणातील काहीतरी बदलते तेव्हा ते खंडित करतात. स्वत: ची सुधारित कृत्रिम बुद्धिमत्ता या प्रकारच्या समस्यांकडे लक्ष देण्याबद्दल आहे. हे जोखीम आणि चालू असलेल्या आव्हानांसह देखील येते. पुढील लेख या नवीन दृष्टिकोनाच्या अलीकडील प्रगती, पद्धती आणि परिणामांचे सर्वेक्षण करतो.

आपल्याकडे एक दस्तऐवज आहे — प्रतिमा स्रोत: www.europarl.europa.eu

स्वत: ची सुधारित म्हणजे काय

या अर्थाने, स्वत: ची सुधारित मॉडेल आहेत:

प्रारंभिक उपयोजनानंतर नवीन डेटा स्रोत आणि अभिप्राय यंत्रणेशी जुळवून घेणारी मॉडेल्स (केवळ नियमित पुनर्रचनेच्या वेळीच नव्हे), वापरकर्त्याचे वर्तन, पर्यावरण डेटा आणि इतर सूचित स्त्रोतांसह.

मॉडेल जे सतत शिक्षण करू शकतात, याचा अर्थ ते कामे अनुक्रमे शिकू शकतात आणि मागील कार्ये विसरल्याशिवाय (तथाकथित 'आपत्तीजनक विसरणे') वेळोवेळी बदलणार्‍या डेटा वितरणाचे व्यवस्थापन करू शकतात.

शक्यतो संसाधन-कार्यक्षम, सुरक्षित मार्गाने असे करा: प्रत्येक वेळी सुरवातीपासून पुनर्प्राप्त करू नका आणि गोंगाट करणारा किंवा प्रतिकूल असू शकेल असा अभिप्राय व्यवस्थापित करा.

अलीकडील घडामोडी: सील, प्रतिस्पर्धी, इतर

ते म्हणाले, येथे अलीकडील काही संशोधन घडामोडी आहेत:

एमआयटी कडून सील (सेल्फ-अ‍ॅडॉप्टिंग भाषा मॉडेल): एक फ्रेमवर्क ज्यामध्ये एलएलएम स्वत: चा सिंथेटिक प्रशिक्षण डेटा व्युत्पन्न करतो (प्रॉम्प्ट्स किंवा इतर नवीन इनपुटवर आधारित) आणि नंतर मजबुतीकरण शिक्षणाचा वापर करून डाउनस्ट्रीम कामगिरीवर आधारित स्वतःचे वजन अद्यतनित करते. स्थिर मॉडेल्सच्या विपरीत, सील मॉडेल सतत जुळवून घेऊ शकते. छोट्या ओपन-सोर्स मॉडेल्सवर आधारित चाचण्या (उदा., लामा किंवा क्वेन) अधिक सातत्याने ज्ञान एकत्रीकरण प्राप्त झाले आणि त्यापेक्षा सीलसह काही-शॉट शिक्षण सुधारले.

प्रतिस्पर्धी: भाषेच्या मॉडेल्सच्या पुनरावृत्ती आणि प्रतिकूल ऑप्टिमायझेशनसह मजबुतीकरण शिक्षण. एक पाइपलाइन जी लक्ष्ये, बक्षीस मॉडेल, प्रतिकूल परिस्थिती आणि कमीतकमी मानवी इनपुटसह लूप पुनर्प्राप्त करते. त्यांचा दृष्टीकोन: मॉडेलच्या कामगिरीचे परीक्षण करा, ओरॅकल्ससह सत्यापित करा आणि अद्यतने ट्रिगर करा. अधिक स्वायत्तता व्युत्पन्न करताना लेबल केलेल्या डेटावरील अवलंबन कमी करण्याची कल्पना आहे.

जनरेटिव्ह मॉडेल्ससाठी सतत शिक्षणावरील अलीकडील सर्वेक्षण: एकंदरीत, जनरेटिव्ह मॉडेल्स (२०२25) मध्ये सतत शिक्षणावरील सर्वसमावेशक सर्वेक्षण सारखे सर्वेक्षण आर्किटेक्चर-आधारित, नियमितीकरण-आधारित आणि रीप्ले-आधारित सतत शिकण्याच्या उद्देशाने पद्धतींचे वर्गीकरण करतात.

मानवी आपल्याकडे पाइन आहे — फ्रीपिक द्वारे प्रतिमा

ते विकसित होणारी कार्ये, नवीन कार्यपद्धती किंवा वापरकर्ता प्राधान्ये आणि असे करण्याच्या पूर्वीची क्षमता टिकवून ठेवण्यासाठी मोठ्या व्हिजन-लँग्वेज मॉडेल्स, डिफ्यूजन मॉडेल आणि एलएलएमच्या क्षमतेची तपासणी करतात.

परस्परसंवादी सतत शिक्षणासाठी नवीन फ्रेमवर्कः उदाहरणार्थ, आरआयसीएल (प्रबलित इंटरएक्टिव्ह सतत शिक्षण) रिअल-टाइममध्ये मानवी अभिप्रायाद्वारे नवीन कौशल्ये शिकण्यास सक्षम असलेल्या यंत्रणेचा विकास करते आणि थेट “गोंगाट” किंवा अपूर्ण अभिप्रायाशी संबंधित आहे-ज्यामध्ये वापरकर्त्यांमधील निवेदनाच्या संदर्भातील अधिक वास्तविक स्पष्टीकरण दिले जाईल.

मुख्य तांत्रिक आव्हाने

आश्वासक असले तरी, स्वत: ची सुधारित एआयला बर्‍याच महत्त्वपूर्ण तांत्रिक आव्हानांचा सामना करावा लागतो.

आपत्ती विसरा वि स्थिरता-प्लॅस्टीटी ट्रेड-ऑफ
जेव्हा एखादे मॉडेल नवीन कार्य कसे करावे हे शिकते तेव्हा ते पूर्वीच्या कार्यांमधून विसरू शकते (किंवा कामगिरीमध्ये घट दर्शवते). केंद्रीय डिझाइनचा प्रश्न आहे की स्थिरता संतुलित कशी करावी (जे शिकले आहे ते ठेवून) वि प्लॅस्टीसीटी (नवीन सामग्री शिकणे).
गोंगाट/अविश्वसनीय अभिप्राय
वास्तविक जगाचा डेटा/वापरकर्त्याचा अभिप्राय बर्‍याचदा गोंधळलेला असतो आणि वापरकर्त्याने प्रदान केलेले सिग्नल पक्षपाती, प्रतिकूल किंवा दिशाभूल करणारे असू शकतात. जर मॉडेलला “कोणत्याही प्रकारचे इनपुट/मार्गदर्शन” नसलेल्या वापरकर्त्यांकडून अभिप्राय शिकले तर मॉडेल हानिकारक पक्षपाती किंवा त्रुटी शिकू शकतात.
गणना आणि संसाधनाची मर्यादा
सतत मोठे मॉडेल (कोट्यवधी पॅरामीटर्स) अद्यतनित करणे खूप संसाधन-केंद्रित आहे. सतत पुन्हा प्रशिक्षण आणि ललित-ट्यूनिंग (विशेषत: मोठ्या डेटासेटसह) त्यांच्या सतत शिक्षणाशी संबंधित संगणकीय शक्ती, साठवण आणि पर्यावरणीय खर्चाची महत्त्वपूर्ण आवश्यकता असेल.
स्वत: ची सुधारणा मूल्यांकन
स्वत: ची सुधारणा सुधारित मॉडेलकडे नेली आहे की नाही याचे मूल्यांकन करणे सोपे नाही. मॉडेल्सना कार्ये आणि वेळेच्या यशाचे मूल्यांकन करण्यासाठी बेंचमार्क, वास्तविक-जगातील मेट्रिक्स आवश्यक असतात. परिस्थितीशी जुळवून घेतल्याने इतर क्षमता कमी होत नाहीत याची आपल्याला खात्री कशी असू शकते?
सुरक्षा, संरेखन आणि अनावश्यक ऑप्टिमायझेशन
जर स्वत: ची सुधारणा प्रॉक्सी उद्दीष्टांसाठी ऑप्टिमाइझ करण्यास परवानगी देत असेल (उदा. गुंतवणूकीचे जास्तीत जास्त करणे, विशिष्ट कार्यांवरील त्रुटी कमी करणे), तर चुकीच्या वर्तनाचा धोका आहे: असे परिणाम जे इच्छित नसतात, बक्षीस कार्य हॅक करण्यासाठी बक्षीस दिले जातात किंवा मानवी हेतूपासून दूर जाणे.
पारदर्शकता आणि अर्थ लावणे
जेव्हा शिक्षण स्वयंचलित असते, ऑडिट करणे किंवा मॉडेलने आपले वर्तन का बदलले हे स्पष्ट करण्यास सक्षम असणे कठीण आहे. मॉडेलने चुकीच्या संघटना, स्टिरिओटाइप्स किंवा असुरक्षित शॉर्टकट शिकले नाहीत यावर आपण विश्वास कसा ठेवू शकतो?

या समस्यांचे निराकरण करण्यासाठी दृष्टिकोन आणि पद्धती

सुरक्षित आणि प्रभावी स्वयं-सुधारित एआयला अनुमती देण्यासाठी संशोधक वेगवेगळे दृष्टिकोन तयार करीत आहेत.

रीप्ले-आधारित पद्धती: भूतकाळातील डेटाचा सबसेट ठेवणे जेणेकरून जेव्हा मॉडेल नवीन कार्ये शिकेल, तेव्हा मागील ज्ञान राखण्यासाठी जुन्या कार्यांची तालीम करण्यास सक्षम असेल.

नेक्स्ट-जनरल एआय — प्रतिमा क्रेडिट: सायबर एक्सप्रेस

नियमित-आधारित पद्धती: मागील कार्यांसाठी महत्त्वपूर्ण असलेल्या मॉडेलचे काही मापदंड बदलू नये म्हणून अनुकूलता; यात ईडब्ल्यूसी (लवचिक वजन एकत्रीकरण) आणि पॅरामीटर महत्त्व दृष्टिकोन यासारख्या पद्धतींचा समावेश असेल.

आर्किटेक्चर-आधारित पद्धतीः मॉड्यूलर आर्किटेक्चर असणे, जेथे नेटवर्कचा एक भाग विशिष्ट कार्ये सोपविला जातो किंवा दृष्टिकोन वाढविणे आणि मॉड्यूलरिझिंग दृष्टिकोन जेणेकरून नवीन कार्ये जुन्या मॉडेल्समध्ये हस्तक्षेप न करता नवीन मॉड्यूल मिळवू शकतील

स्वयं-पर्यवेक्षी शिक्षण आणि कृत्रिम डेटा: स्व-पर्यवेक्षण शिक्षण कमी मानवी-लेबल असलेल्या उदाहरणांसह शिक्षण सिग्नल तयार करण्यासाठी छद्म-लेबल्स, कृत्रिम उदाहरणे किंवा लेव्हरेज लेव्हरेजेस तयार करते. सील (कंपास फ्रेमवर्क) अशी एक प्रणाली आहे जी स्वतःचा सिंथेटिक डेटा व्युत्पन्न करते.

मानवी अभिप्राय / प्राधान्य सिग्नल: मॉडेलच्या शिफारशींचे मार्गदर्शन नियमितपणे तपासणे, समायोजित करणे किंवा मदत करणे फायदेशीर आहे. मुख्य विचार हे आश्वासन देत आहे की काही गंभीर डोमेन (आरोग्य आणि सुरक्षा) ओलांडून मानवी निरीक्षण अभिप्राय लूपमध्ये आहे.

वास्तविक जगाची उदाहरणे आणि प्रोटोटाइप

सील (एमआयटी): सील दोन्ही ज्ञान एकत्रीकरण (नवीन तथ्ये) आणि काही शॉट कार्यांमध्ये गुंतलेले आहे, जे केवळ स्थिर किंवा सोप्या अनुकूलन प्रक्रियेचा अवलंब करण्यापेक्षा मजबूत कामगिरीचे फायदे दर्शविते.

डार्विन गोडेल मशीन: अधिक सट्टेबाज/प्रायोगिक “एजंट”, जो प्रोग्रामिंग कार्यांवरील चांगल्या कामगिरीसाठी कोड-बेस स्वत: ला सुधारित करीत आहे, डार्विन गेडेल मशीन आहे. हे एजीआय उदाहरण अत्यंत मानवी-स्तरीय एजीआयचे नाही, परंतु स्वत: ची सुधारित कोड होऊ शकतो हे प्रशंसनीय होऊ लागले आहे. एक्सप्लोर करण्यासाठी जे काही शिल्लक आहे ते म्हणजे स्वत: ची सुधारणा (शिकणे) जे एजंटला फायदा करते आणि केवळ मानवी देखरेखीवर अवलंबून नसते.

नैतिक, सामाजिक आणि शासन विचार

स्वत: ची सुधारित एआय खालील बाजूंनी अतिरिक्त नैतिक आणि धोरणात्मक प्रश्न आणते:

उत्तरदायित्व: जर एखादे मॉडेल स्वत: ची अद्ययावत करते आणि नंतर हानी पोहोचवते तर कोण जबाबदार आहे? ते मूळ लेखक/विकसक होते? संभाव्य किंवा अद्ययावत मॉडेल?

अद्यतनांची पारदर्शकता: जेव्हा एआय आपला प्रतिसाद बदलते, तेव्हा वापरकर्त्यांना आणि लेखा परीक्षकांना बदलांबद्दल लॉग आणि दस्तऐवजांची माहिती आवश्यक असू शकते – बदल काय होता, बदल केव्हा झाला, बदल घडवून आणला, इ.

नियंत्रण / सेफ रोलबॅकः एजंट नियंत्रित करण्यासाठी आणि स्प्रिंट-आउट होऊ लागल्यास सेफ रोलबॅक लागू करण्यासाठी आवश्यक असलेल्या कार्यपद्धती आणि सिस्टम असू शकतात.

बायस एम्प्लिफिकेशन: डेटाचे नवीन स्त्रोत सिस्टममध्ये हानिकारक पक्षपाती किंवा स्टिरिओटाइप्सला त्रास देऊ शकतात, विशेषत: जेव्हा अभिप्राय पळवाट अल्पसंख्याक किंवा असमान दृश्यांमधून इनपुटमध्ये संतुलन ठेवत नाहीत, शेवटी मूळ, शक्तिशाली पक्षपातीची प्रतिकृती बनवतात.

गोपनीयता: जर मॉडेल वापरकर्त्याच्या प्रवासातून शिकण्यास सक्षम असतील तर माहिती लीक झाल्यास डेटा गोपनीयता, संमती आणि संभाव्यत: संवेदनशील माहिती सामायिक करणार्‍या महत्त्वपूर्ण समस्या उद्भवतात.

एआय एकत्रीकरण 2 — स्वयं-सुधारित एआय मॉडेल्सचे भविष्य: स्मार्ट, सुरक्षित आणि क्रांतिकारक बुद्धिमत्ता अनलॉक करणे 1

संसाधन/पर्यावरणीय खर्च: मॉडेल प्रशिक्षित करण्यासाठी मॉडेलची संगणकीय (ऊर्जा) आवश्यक आहे, डेटा संचयित करणे इ. हे प्रभाव मोजले जावेत आणि मर्यादित केले जावे.

जिथे गोष्टी जाऊ शकतात

येथे काही मनोरंजक फ्रंटियर्स आहेत:

मॉड्यूलर किंवा विघटनशील एआय कॉन्फिगरेशनः एका मॉडेलऐवजी एक अखंडपणे स्वत: ची सुधारित करणारी, विशेष एजंट्सची रचना जी एकत्रितपणे कार्य करते, प्रत्येकजण कौशल्याच्या विशिष्ट क्षेत्रात सुधारणा करू शकतो, परंतु ऑर्केस्ट्रेशनमध्ये एकत्र काम करू शकतो.

एज डिव्हाइसवर सतत शिक्षणः एज कॉम्प्यूटिंग डिव्हाइस (फोन, आयओटी) वर शिकू शकणारे मॉडेल, केंद्रीकृत डेटा सेंटरवर डेटा परत न पाठविल्याशिवाय सिस्टमचे वैयक्तिकरण सक्षम करतात; एकाच वेळी गोपनीयता समस्यांचे निराकरण करणे आणि विलंब सुधारणे.

चांगले सिंथेटिक डेटा आणि मानवी अभिप्राय पळवाट: प्रशिक्षणासाठी चांगले कृत्रिम डेटा तयार करणे, मानवांद्वारे प्रतिक्रिया/अभिप्राय लूप डेटा सुधारणे आणि नवीन मॉडेल पुनरावृत्तीच्या प्रतिकूल प्रक्रियेची अधिक चांगली चाचणी करणे.

स्वयं-सुधारित मॉडेल्सच्या आसपास नियामक आणि मानके: अ‍ॅडॉप्टिव्ह मॉडेल्सच्या आसपास प्रमाणपत्र यंत्रणा; ऑडिट आवश्यकता; तसेच अनुकूलन यंत्रणेसाठी सुरक्षा मानकांभोवती धोरणात्मक यंत्रणा, म्हणून संस्था स्वायत्ततेसह “सेल्फ-लर्निंग” तंत्रज्ञान तैनात करू शकत नाहीत.

निष्कर्ष

एआय मधील स्वत: ची सुधारित एआय मॉडेल्सची वाढ ही सर्वात रोमांचक घडामोडी आहे. संकल्पनेनुसार, हे अशा प्रणालींचे वचन देते जे अद्ययावत राहतात, नवीन परिस्थितीशी जुळवून घेतात, वापरकर्त्याच्या गरजेनुसार वैयक्तिकृत करतात आणि कदाचित नवीन क्षमता देखील शोधतात. सील, प्रतिस्पर्धी आणि सतत शिकण्याच्या संशोधनासारख्या प्रारंभिक प्रोटोटाइप आणि फ्रेमवर्कमध्ये महत्त्वपूर्ण प्रगती दिसून येते. परंतु आम्ही अद्याप अशा ठिकाणी नाही जिथे व्यापक, पूर्णपणे स्वायत्त, सुरक्षित स्वत: ची सुधारणा ही नियमित आहे.

आय चिप स्टार्टअप — स्वयं-सुधारित एआय मॉडेल्सचे भविष्य: अनलॉक करणे हुशार, सुरक्षित आणि क्रांतिकारक बुद्धिमत्ता 2

अभियंता, नीतिशास्त्रज्ञ, नियामक आणि वापरकर्त्यांनी एकत्रितपणे व्यापार-ऑफकडे लक्ष दिले पाहिजे: स्थिरता वि. बदल, गोपनीयता वि. वैयक्तिकरण, स्वायत्तता वि. नियंत्रण. एक चांगला चाललेला मार्ग एआय सिस्टमला कारणीभूत ठरू शकतो जो अधिक उपयुक्त, अधिक लवचिक आणि मानवी मूल्यांसह अधिक संरेखित आहे. असमाधानकारकपणे शासित व्यक्ती वापरकर्त्यांकडे जोखीम बदलू शकतो, पक्षपातीपणा किंवा त्रुटी वाढवू शकतो किंवा अप्रत्याशित वर्तन तयार करू शकतो. सरतेशेवटी, स्वत: ची सुधारित एआयमध्ये परिवर्तनाची क्षमता आहे-परंतु केवळ जर आपण काळजीपूर्वक चाललो तर