ओपनएआय म्हणते की एआय ब्राउझर नेहमी प्रॉम्प्ट इंजेक्शन हल्ल्यांसाठी असुरक्षित असू शकतात

जरी OpenAI त्याच्या Atlas AI ब्राउझरला सायबर हल्ल्यांविरूद्ध कठोर करण्यासाठी कार्य करत असताना, कंपनी कबूल करते की प्रॉम्प्ट इंजेक्शन्स, एक प्रकारचा हल्ला जो AI एजंट्सना वेब पेजेस किंवा ईमेलमध्ये लपवलेल्या दुर्भावनापूर्ण सूचनांचे पालन करण्यासाठी हाताळतो, हा एक धोका आहे जो कधीही दूर होणार नाही — AI एजंट उघडे वेबवर किती सुरक्षितपणे काम करू शकतात याबद्दल प्रश्न उपस्थित करते.

“वेबवरील घोटाळे आणि सामाजिक अभियांत्रिकी सारखे त्वरित इंजेक्शन, पूर्णपणे 'निराकरण' होण्याची शक्यता नाही,” OpenAI ने सोमवारी लिहिले ब्लॉग पोस्ट अखंडित हल्ल्यांचा मुकाबला करण्यासाठी फर्म ॲटलसचे चिलखत कसे वाढवत आहे याचे तपशील. कंपनीने कबूल केले की ChatGPT Atlas मधील “एजंट मोड” “सुरक्षा धोक्याची पृष्ठभाग विस्तृत करतो.”

OpenAI ने ऑक्टोबरमध्ये त्याचे ChatGPT Atlas ब्राउझर लाँच केले, आणि सुरक्षा संशोधकांनी त्यांचे डेमो प्रकाशित करण्यासाठी धाव घेतली, ते दर्शविते की Google डॉक्समध्ये काही शब्द लिहिणे शक्य आहे जे अंतर्निहित ब्राउझरचे वर्तन बदलण्यास सक्षम आहेत. त्याच दिवशी, शूर एक ब्लॉग पोस्ट प्रकाशित अप्रत्यक्ष प्रॉम्प्ट इंजेक्शन हे एआय-सक्षम ब्राउझरसाठी एक पद्धतशीर आव्हान आहे हे स्पष्ट करणे, ज्यात पर्प्लेक्सिटीच्या धूमकेतूचा समावेश आहे.

प्रॉम्प्ट-आधारित इंजेक्शन्स दूर होत नाहीत हे ओळखण्यासाठी OpenAI एकटा नाही. द यूकेच्या राष्ट्रीय सायबर सुरक्षा केंद्राने या महिन्याच्या सुरुवातीला इशारा दिला होता जनरेटिव्ह एआय ऍप्लिकेशन्सच्या विरूद्ध त्वरित इंजेक्शन हल्ले “कदाचित पूर्णपणे कमी केले जाऊ शकत नाहीत,” वेबसाइट्सना डेटा उल्लंघनास बळी पडण्याचा धोका आहे. यूके सरकारी एजन्सीने सायबर व्यावसायिकांना हल्ले “थांबवले” असे वाटण्याऐवजी त्वरित इंजेक्शनचा धोका आणि प्रभाव कमी करण्याचा सल्ला दिला.

OpenAI च्या भागासाठी, कंपनीने म्हटले: “आम्ही प्रॉम्प्ट इंजेक्शनला दीर्घकालीन AI सुरक्षा आव्हान म्हणून पाहतो आणि आम्हाला त्याविरूद्ध आमचे संरक्षण सतत मजबूत करणे आवश्यक आहे.”

या सिसिफीन टास्कला कंपनीचे उत्तर? फर्म म्हणते की एक सक्रिय, जलद-प्रतिसाद चक्र “जंगलीत” शोषण होण्याआधी आंतरिकपणे नवीन हल्ल्याची रणनीती शोधण्यात मदत करण्याचे लवकर वचन दर्शवित आहे.

अँथ्रोपिक आणि Google सारख्या प्रतिस्पर्ध्यांपेक्षा ते पूर्णपणे वेगळे नाही: प्रॉम्प्ट-आधारित हल्ल्यांच्या सततच्या जोखमीशी लढण्यासाठी, संरक्षण स्तरबद्ध आणि सतत तणाव-चाचणी करणे आवश्यक आहे. Google चे अलीकडील कार्यउदाहरणार्थ, एजंटिक सिस्टमसाठी आर्किटेक्चरल आणि पॉलिसी-स्तरीय नियंत्रणांवर लक्ष केंद्रित करते.

परंतु जेथे ओपनएआय त्याच्या “LLM-आधारित स्वयंचलित आक्रमणकर्त्यासह” वेगळी युक्ती घेत आहे. हा आक्रमणकर्ता मुळात एक बॉट आहे ज्याला OpenAI ने प्रशिक्षित केले आहे, मजबुतीकरण शिक्षण वापरून, हॅकरची भूमिका बजावण्यासाठी जो AI एजंटला दुर्भावनापूर्ण सूचना चोरण्याचे मार्ग शोधतो.

बॉट वास्तविकतेसाठी वापरण्यापूर्वी सिम्युलेशनमध्ये हल्ल्याची चाचणी करू शकतो आणि सिम्युलेटर लक्ष्य AI कसा विचार करेल आणि हल्ला पाहिल्यास काय कारवाई करेल हे दर्शवितो. बॉट नंतर त्या प्रतिसादाचा अभ्यास करू शकतो, हल्ला बदलू शकतो आणि पुन्हा पुन्हा प्रयत्न करू शकतो. लक्ष्य AI च्या अंतर्गत तर्कातील अंतर्दृष्टी ही अशी गोष्ट आहे ज्यामध्ये बाहेरील लोकांना प्रवेश नाही, म्हणून, सिद्धांतानुसार, OpenAI चा बॉट वास्तविक-जगातील आक्रमणकर्त्यापेक्षा अधिक वेगाने त्रुटी शोधण्यात सक्षम असावा.

AI सुरक्षा चाचणीमध्ये ही एक सामान्य युक्ती आहे: एज केसेस शोधण्यासाठी एजंट तयार करा आणि सिम्युलेशनमध्ये त्यांच्या विरुद्ध वेगाने चाचणी करा.

“आमचे (मजबुतीकरण शिक्षण) प्रशिक्षित आक्रमणकर्ते एजंटला अत्याधुनिक, लांब-क्षितिज हानीकारक कार्यप्रवाह चालवू शकतात जे दहापट (किंवा अगदी शेकडो) पायऱ्यांवर उलगडतात,” OpenAI लिहिले. “आम्ही आमच्या मानवी लाल टीमिंग मोहिमेमध्ये किंवा बाह्य अहवालांमध्ये न दिसणाऱ्या कादंबरी हल्ल्याच्या धोरणांचे निरीक्षण केले.”

प्रतिमा क्रेडिट्स:OpenAI

डेमोमध्ये (वरील भागामध्ये चित्रित), OpenAI ने दाखवले की त्याच्या स्वयंचलित आक्रमणकर्त्याने दुर्भावनापूर्ण ईमेल वापरकर्त्याच्या इनबॉक्समध्ये कसे सरकवले. जेव्हा एआय एजंटने नंतर इनबॉक्स स्कॅन केला, तेव्हा त्याने ईमेलमधील लपलेल्या सूचनांचे पालन केले आणि ऑफिसबाहेरील उत्तराचा मसुदा तयार करण्याऐवजी राजीनामा संदेश पाठवला. परंतु सुरक्षा अद्यतनानंतर, कंपनीच्या म्हणण्यानुसार, “एजंट मोड” प्रॉम्प्ट इंजेक्शनचा प्रयत्न यशस्वीरित्या शोधण्यात आणि वापरकर्त्यास ध्वजांकित करण्यात सक्षम झाला.

कंपनीचे म्हणणे आहे की प्रॉम्प्ट इंजेक्शनला सुरक्षितपणे सुरक्षित करणे कठीण असले तरी, ते रिअल-वर्ल्ड हल्ल्यांमध्ये दिसण्यापूर्वी मोठ्या प्रमाणावर चाचणी आणि वेगवान पॅच सायकलवर आपली यंत्रणा कठोर बनवते.

ओपनएआयच्या प्रवक्त्याने ॲटलसच्या सुरक्षिततेच्या अपडेटमुळे यशस्वी इंजेक्शन्समध्ये मापनीय घट झाली आहे की नाही हे सांगण्यास नकार दिला, परंतु कंपनी लॉन्च होण्याआधीपासून ॲटलसला प्रॉम्प्ट इंजेक्शनच्या विरूद्ध कठोर करण्यासाठी तृतीय पक्षांसोबत काम करत आहे.

सायबर सिक्युरिटी फर्म विझचे प्रमुख सुरक्षा संशोधक रामी मॅकार्थी म्हणतात की रीइन्फोर्समेंट लर्निंग हा हल्लेखोरांच्या वर्तनाशी सतत जुळवून घेण्याचा एक मार्ग आहे, परंतु तो चित्राचा फक्त एक भाग आहे.

“एआय सिस्टममधील जोखमीबद्दल तर्क करण्याचा एक उपयुक्त मार्ग म्हणजे प्रवेशाद्वारे गुणाकार केलेली स्वायत्तता,” मॅककार्थीने रीडला सांगितले.

“एजंटिक ब्राउझर त्या जागेच्या एका आव्हानात्मक भागात बसतात: मध्यम स्वायत्तता आणि अतिशय उच्च प्रवेशासह,” मॅककार्थी म्हणाले. “बऱ्याच सद्य शिफारशी त्या ट्रेड-ऑफला प्रतिबिंबित करतात. लॉग-इन केलेला प्रवेश मर्यादित करणे प्रामुख्याने एक्सपोजर कमी करते, तर पुष्टीकरण विनंत्यांच्या पुनरावलोकनाची आवश्यकता स्वायत्तता मर्यादित करते.”

वापरकर्त्यांना त्यांचा स्वतःचा धोका कमी करण्यासाठी OpenAI च्या त्या दोन शिफारसी आहेत आणि एका प्रवक्त्याने सांगितले की ॲटलास संदेश पाठवण्यापूर्वी किंवा पेमेंट करण्यापूर्वी वापरकर्त्याची पुष्टी मिळविण्यासाठी प्रशिक्षित आहे. ओपनएआय असेही सुचविते की वापरकर्ते एजंटांना तुमच्या इनबॉक्समध्ये प्रवेश देण्याऐवजी आणि त्यांना “काहीही कारवाई करणे आवश्यक आहे” असे सांगण्याऐवजी विशिष्ट सूचना देतात.

OpenAI नुसार, “विस्तृत अक्षांश लपविलेल्या किंवा दुर्भावनापूर्ण सामग्रीसाठी एजंटवर प्रभाव टाकणे सोपे करते, जरी सुरक्षिततेच्या ठिकाणी आहेत.”

ओपनएआय म्हणते की ॲटलस वापरकर्त्यांना प्रॉम्प्ट इंजेक्शन्सपासून संरक्षण करणे ही सर्वोच्च प्राथमिकता आहे, मॅककार्थी जोखीम-प्रवण ब्राउझरसाठी गुंतवणूकीवरील परताव्याच्या काही शंकांना आमंत्रित करते.

“बहुतेक दैनंदिन वापराच्या प्रकरणांसाठी, एजंटिक ब्राउझर अद्याप त्यांच्या वर्तमान जोखीम प्रोफाइलचे समर्थन करण्यासाठी पुरेसे मूल्य प्रदान करत नाहीत,” मॅककार्थीने रीडला सांगितले. “ईमेल आणि पेमेंट माहिती सारख्या संवेदनशील डेटावर त्यांचा प्रवेश दिल्याने धोका जास्त आहे, जरी तो प्रवेश देखील त्यांना शक्तिशाली बनवतो. ते संतुलन विकसित होईल, परंतु आज ट्रेड-ऑफ अजूनही खूप वास्तविक आहेत.”

Comments are closed.