मजबुतीकरण अंतर – किंवा काही एआय कौशल्ये इतरांपेक्षा वेगवान का सुधारतात

एआय कोडिंग साधने वेगवान होत आहेत. आपण कोडमध्ये काम करत नसल्यास, गोष्टी किती बदलत आहेत हे लक्षात घेणे कठीण आहे, परंतु जीपीटी -5 आणि मिथुन 2.5 ने विकसकांच्या युक्त्यांचा संपूर्ण नवीन सेट स्वयंचलित करणे शक्य केले आहे आणि गेल्या आठवड्यात सॉनेट २.4 ने पुन्हा ते केले.

त्याच वेळी, इतर कौशल्ये अधिक हळू हळू प्रगती करत आहेत. आपण ईमेल लिहिण्यासाठी एआय वापरत असल्यास, कदाचित एक वर्षापूर्वी आपण त्याद्वारे समान मूल्य मिळवत आहात. मॉडेल चांगले झाल्यावरही, उत्पादनास नेहमीच फायदा होत नाही – विशेषत: जेव्हा उत्पादन एकाच वेळी डझनभर वेगवेगळ्या नोकर्‍या करत असते. एआय अद्याप प्रगती करीत आहे, परंतु हे पूर्वीसारखे समान प्रमाणात वितरित केलेले नाही.

प्रगतीमधील फरक जितका वाटतो त्यापेक्षा सोपा आहे. कोडिंग अॅप्स कोट्यावधी सहजपणे मोजण्यायोग्य चाचण्यांचा फायदा घेत आहेत, जे त्यांना कार्यक्षम कोड तयार करण्यासाठी प्रशिक्षण देऊ शकतात. हे मजबुतीकरण शिक्षण (आरएल) आहे, गेल्या सहा महिन्यांपासून एआयच्या प्रगतीचा सर्वात मोठा ड्रायव्हर आणि सर्व वेळ अधिक गुंतागुंतीचा आहे. आपण मानवी ग्रेडर्ससह मजबुतीकरण शिकू शकता, परंतु जर स्पष्ट पास-फेल मेट्रिक असेल तर ते चांगले कार्य करते, जेणेकरून आपण मानवी इनपुटसाठी थांबल्याशिवाय कोट्यावधी वेळा पुन्हा पुन्हा पुन्हा पुन्हा पुन्हा पुन्हा पुन्हा पुन्हा सांगू शकता.

उद्योग सुधारण्यासाठी मजबुतीकरण शिकण्यावर उद्योग वाढत असताना, आम्ही आपोआप वर्गीकृत केल्या जाऊ शकतात अशा क्षमतांमध्ये वास्तविक फरक पाहत आहोत आणि जे करू शकत नाहीत. बग-फिक्सिंग आणि स्पर्धात्मक गणित यासारख्या आरएल-अनुकूल कौशल्ये अधिक वेगवान होत आहेत, तर लेखनासारख्या कौशल्यांनी केवळ वाढीव प्रगती केली आहे.

थोडक्यात, एक मजबुतीकरण अंतर आहे – आणि एआय सिस्टम काय करू शकतात आणि काय करू शकत नाहीत यासाठी हे सर्वात महत्त्वाचे घटक बनत आहे.

काही मार्गांनी, सॉफ्टवेअर डेव्हलपमेंट हा मजबुतीकरण शिक्षणासाठी योग्य विषय आहे. एआयच्या आधीही, सॉफ्टवेअर दबावाखाली कसे ठेवेल याची चाचणी करण्यासाठी एक संपूर्ण उप-शिस्त समर्पित होती-मुख्य म्हणजे विकसकांना त्यांचा कोड तैनात करण्यापूर्वी त्यांचा कोड खंडित होणार नाही याची खात्री करणे आवश्यक आहे. म्हणून अगदी सर्वात मोहक कोड देखील युनिट चाचणी, एकत्रीकरण चाचणी, सुरक्षा चाचणी इत्यादीद्वारे अद्याप पास करणे आवश्यक आहे. मानवी विकसक त्यांचा कोड सत्यापित करण्यासाठी नियमितपणे या चाचण्या वापरतात आणि Google च्या डीईव्ही टूल्सच्या वरिष्ठ संचालकांनी मला अलीकडेच सांगितले की ते एआय-व्युत्पन्न कोड मान्य करण्यासाठी तितकेच उपयुक्त आहेत. त्याहूनही अधिक, ते मजबुतीकरण शिक्षणासाठी उपयुक्त आहेत, कारण ते आधीपासूनच मोठ्या प्रमाणावर पद्धतशीर आणि पुनरावृत्ती करण्यायोग्य आहेत.

एक चांगले लिहिलेले ईमेल किंवा चांगला चॅटबॉट प्रतिसाद सत्यापित करण्याचा कोणताही सोपा मार्ग नाही; ही कौशल्ये मूळतः व्यक्तिनिष्ठ आणि मोजमाप करणे कठीण आहेत. परंतु प्रत्येक कार्य सुबकपणे “चाचणी करणे सोपे” किंवा “चाचणी करणे कठीण” श्रेणींमध्ये येत नाही. आमच्याकडे तिमाही वित्तीय अहवाल किंवा वास्तविक विज्ञानासाठी बॉक्स-ऑफ-द-बॉक्स टेस्टिंग किट नाही, परंतु एक चांगला भांडवलदार अकाउंटिंग स्टार्टअप कदाचित सुरवातीपासून एक तयार करू शकेल. काही चाचणी किट अर्थातच इतरांपेक्षा चांगले कार्य करतील आणि काही कंपन्या समस्येकडे कसे जायचे याबद्दल हुशार असतील. परंतु अंतर्निहित प्रक्रियेची चाचणीता केवळ एक रोमांचक डेमोऐवजी मूलभूत प्रक्रिया कार्यशील उत्पादनात बनविली जाऊ शकते की नाही याचा निर्णय घेणारा घटक ठरणार आहे.

टेकक्रंच इव्हेंट

सॅन फ्रान्सिस्को
|
ऑक्टोबर 27-29, 2025

काही प्रक्रिया आपल्या विचार करण्यापेक्षा अधिक चाचणी करण्यायोग्य ठरतात. जर आपण गेल्या आठवड्यात मला विचारले असेल तर मी एआय-व्युत्पन्न व्हिडिओ “हार्ड टू टेस्ट टू टेस्ट” प्रकारात ठेवला असता, परंतु ओपनईच्या नवीन सोरा 2 मॉडेलने केलेल्या अफाट प्रगतीमुळे हे दिसते तितके कठीण नाही. सोरा 2 मध्ये, वस्तू यापुढे दिसणार नाहीत आणि कोठूनही अदृश्य होत नाहीत. चेहरे त्यांचे आकार ठेवतात, केवळ वैशिष्ट्यांच्या संग्रहातून एखाद्या विशिष्ट व्यक्तीसारखे दिसतात. सोरा 2 फुटेज दोन्हीमध्ये भौतिकशास्त्राच्या कायद्यांचा आदर करते स्पष्ट आणि सूक्ष्म मार्ग. मला शंका आहे की, जर आपण पडद्यामागे डोकावले तर आपल्याला या प्रत्येक गुणांसाठी एक मजबूत मजबुतीकरण शिक्षण प्रणाली सापडेल. एकत्र ठेवा, ते फोटोरेलिझम आणि एक मनोरंजक भ्रम यात फरक करतात.

स्पष्टपणे सांगायचे तर, कृत्रिम बुद्धिमत्तेचा हा कठोर आणि वेगवान नियम नाही. हे एआय विकासात मध्यवर्ती भूमिकेच्या मजबुतीकरण शिक्षणाचा एक परिणाम आहे, जे मॉडेल विकसित झाल्यावर सहज बदलू शकतात. परंतु जोपर्यंत आरएल हे एआय उत्पादने बाजारात आणण्याचे प्राथमिक साधन आहे, तोपर्यंत मजबुतीकरण अंतर केवळ मोठे होईल – स्टार्टअप्स आणि मोठ्या प्रमाणात अर्थव्यवस्था या दोहोंसाठी गंभीर परिणाम. जर एखादी प्रक्रिया मजबुतीकरणाच्या अंतराच्या उजव्या बाजूला संपली तर स्टार्टअप्स कदाचित स्वयंचलित करण्यात यशस्वी होतील – आणि आता ते काम करणारे कोणीही नवीन करिअरचा शोध घेतील. कोणत्या आरोग्य सेवा आरएल-ट्रेन करण्यायोग्य आहेत या प्रश्नावर पुढील 20 वर्षांत अर्थव्यवस्थेच्या आकारासाठी प्रचंड परिणाम आहेत. आणि जर सोरा 2 सारख्या आश्चर्यांसाठी काही संकेत असतील तर आम्हाला उत्तरासाठी जास्त वेळ थांबण्याची गरज नाही.

Comments are closed.