मेटा एआय सुरक्षा संशोधकाने सांगितले की एक ओपनक्लॉ एजंट तिच्या इनबॉक्समध्ये गोंधळून गेला

द आता व्हायरल एक्स पोस्ट Meta AI सुरक्षा संशोधक समर यू कडून, सुरुवातीला व्यंग्यासारखे वाचले. तिने ओपनक्लॉ एआय एजंटला तिचा ओव्हरस्टफ केलेला ईमेल इनबॉक्स तपासण्यास सांगितले आणि काय हटवायचे किंवा संग्रहित करायचे ते सुचवले.
एजंट आपापसात धावायला निघाला. ती थांबवायला सांगणाऱ्या तिच्या फोनवरून आलेल्या तिच्या आदेशांकडे दुर्लक्ष करून तिने “स्पीड रन” मध्ये तिचे सर्व ईमेल हटवण्यास सुरुवात केली.
“मी बॉम्ब निकामी करत असल्याप्रमाणे मला माझ्या मॅक मिनीकडे धाव घ्यावी लागली,” तिने लिहिले, पावत्या म्हणून दुर्लक्षित स्टॉप प्रॉम्प्टच्या प्रतिमा पोस्ट केल्या.
मॅक मिनी, एक परवडणारा ऍपल संगणक जो डेस्कवर सपाट बसतो आणि आपल्या हाताच्या तळहातावर बसतो, हे आजकाल OpenClaw चालविण्यासाठी एक आवडते उपकरण बनले आहे. (मिनी “हॉटकेक सारखी” विकत आहे,” एका “गोंधळलेल्या” Apple कर्मचाऱ्याने वरवर सांगितले प्रसिद्ध AI संशोधक आंद्रेज करपथी जेव्हा त्याने नॅनोक्लॉ नावाचा ओपनक्लॉ पर्याय चालवण्यासाठी एक विकत घेतला.)
ओपनक्लॉ अर्थातच ओपन सोर्स एआय एजंट आहे ज्याने मोल्टबुक या केवळ एआय-सोशल नेटवर्कद्वारे प्रसिद्धी मिळवली. ओपनक्लॉ एजंट हे मोल्टबुकवर आता मोठ्या प्रमाणावर डिबंक केलेल्या एपिसोडच्या केंद्रस्थानी होते ज्यामध्ये असे दिसते की एआय मानवांविरुद्ध कट रचत आहेत.
पण OpenClaw चे ध्येय, त्यानुसार GitHub पृष्ठसामाजिक नेटवर्कवर केंद्रित नाही. हे वैयक्तिक AI सहाय्यक बनण्याचे उद्दिष्ट आहे जे तुमच्या स्वतःच्या डिव्हाइसेसवर चालते.
सिलिकॉन व्हॅलीमधील लोक ओपनक्लॉच्या इतके प्रेमात पडले आहेत की “पंजा” आणि “पंजा” बनले आहेत आवडीचे buzzwords वैयक्तिक हार्डवेअरवर चालणाऱ्या एजंटसाठी. अशा इतर एजंटांचा समावेश आहे झिरोक्लॉ, IronClawआणि पिकोक्लॉ. Y Combinator ची पॉडकास्ट टीम अगदी त्यांच्या वर दिसली सर्वात अलीकडील भाग लॉबस्टर पोशाख परिधान.
टेकक्रंच इव्हेंट
बोस्टन, एमए
|
9 जून 2026
पण Yue ची पोस्ट एक चेतावणी म्हणून काम करते. X वर इतरांनी नमूद केल्याप्रमाणे, जर एआय सुरक्षा संशोधक या समस्येचा सामना करू शकत असेल, तर केवळ मनुष्यांना काय आशा आहे?
“तुम्ही जाणूनबुजून त्याच्या रेलिंगची चाचणी करत आहात की तुम्ही धोकेबाज चूक केली?” एका सॉफ्टवेअर डेव्हलपरने तिला X वर विचारले.
“रूकी मिस्टेक टीबीएच,” तिने उत्तर दिले. ती तिच्या एजंटची एका लहान “टॉय” इनबॉक्ससह चाचणी करत होती, जसे तिने त्याला म्हटले होते आणि ते कमी महत्त्वाच्या ईमेलवर चांगले चालत होते. याने तिचा विश्वास संपादन केला होता, म्हणून तिला वाटले की ती खरी गोष्ट सोडून देईल.
यूचा असा विश्वास आहे की तिच्या वास्तविक इनबॉक्समधील डेटाच्या मोठ्या प्रमाणामुळे “कॅम्पॅक्शन ट्रिगर झाले,” तिने लिहिले. कॉम्पॅक्शन तेव्हा होते जेव्हा कॉन्टेक्स्ट विंडो — एआयने सांगितलेल्या आणि सेशनमध्ये केलेल्या प्रत्येक गोष्टीचा रनिंग रेकॉर्ड — खूप मोठा होतो, ज्यामुळे एजंट संभाषणाचा सारांश, संकुचित आणि व्यवस्थापित करण्यास सुरुवात करतो.
त्या वेळी, AI मानवाला खूप महत्त्वाच्या मानलेल्या सूचनांवरून वगळू शकते.
या प्रकरणात, तिने तिचा शेवटचा प्रॉम्प्ट वगळला असेल — जिथे तिने कृती करू नका असे सांगितले होते — आणि “टॉय” इनबॉक्समधून त्याच्या सूचनांवर परत आले.
इतर अनेक म्हणून एक्स वर निदर्शनास आणले, सूचनांवर विश्वास ठेवला जाऊ शकत नाही सुरक्षा रेलिंग म्हणून काम करणे. मॉडेल चुकीचा अर्थ लावू शकतात किंवा त्यांच्याकडे दुर्लक्ष करू शकतात.
एजंटला थांबवण्यासाठी Yue या अचूक वाक्यरचनेपासून, रेलिंगचे अधिक चांगले पालन सुनिश्चित करण्यासाठी विविध पद्धती, जसे की समर्पित फायलींवर सूचना लिहिणे किंवा इतर मुक्त स्रोत साधने वापरणे यासारख्या सूचना विविध लोकांनी दिल्या.
पूर्ण पारदर्शकतेच्या हितासाठी, Read स्वतंत्रपणे Yue च्या इनबॉक्समध्ये काय झाले याची पडताळणी करू शकत नाही. (तिने आमच्या टिप्पणीसाठी केलेल्या विनंतीला प्रतिसाद दिला नाही, जरी तिने अनेक प्रश्नांना प्रतिसाद दिला आणि टिप्पण्यांनी तिला X वर पाठवले.)
पण खरोखर काही फरक पडत नाही.
कथेचा मुद्दा असा आहे की एजंट जे ज्ञान कामगारांना उद्देशून आहेत, त्यांच्या विकासाच्या सध्याच्या टप्प्यावर, धोकादायक आहेत. जे लोक म्हणतात की ते यशस्वीरित्या वापरत आहेत ते स्वतःचे संरक्षण करण्यासाठी पद्धती एकत्र करत आहेत.
एक दिवस, कदाचित लवकरच (2027? 2028 पर्यंत?), ते व्यापक वापरासाठी तयार होतील. गुडनेसला माहित आहे की आपल्यापैकी बऱ्याच जणांना ईमेल, किराणा मालाच्या ऑर्डर आणि डेंटिस्ट भेटींचे वेळापत्रक तयार करण्यात मदत आवडेल. पण तो दिवस अजून आलेला नाही.
Comments are closed.