झोहो विकसनशील ऊर्जा कार्यक्षम इंडिक एलएलएम

By Marathi On Mar 4, 2025

सारांश

सास युनिकॉर्न झोहो हे स्वतःचे मोठे भाषा मॉडेल (एलएलएम) तयार करीत आहे, जे सामान्य एआय मॉडेल आणि इंडिक भाषा मॉडेल या दोहोंवर लक्ष केंद्रित करते. एक मजबूत डेटासेट विकसित करण्यासाठी कंपनी आयआयटी, एआय 4 बीहारात आणि डेटा संकलन कंपन्यांसह सहयोग करीत आहे

ओपन सारख्या भव्य पॉवर-भुकेलेल्या मॉडेलऐवजी झोहो उर्जा-कार्यक्षम, उजव्या आकाराच्या एलएलएमकडे लक्ष देत आहे. हे विसंगती शोधणे, अंदाज आणि सुरक्षा अल्गोरिदम यासारख्या आयटी अनुप्रयोगांसाठी “अनुलंबकरण” वर लक्ष केंद्रित करीत आहे.

सध्या, झोहोने 80 पेक्षा जास्त आयटी मूळ, बेस्पोक एआय अल्गोरिदम तैनात केल्याचा दावा केला आहे जे कंपनीच्या एंटरप्राइझ आयटी मॅनेजमेंट डिव्हिजनमध्ये दरमहा 5 बीएन एपीआय कॉल करते.

सास युनिकॉर्न झोहो भारतीय भाषांवर लक्ष केंद्रित करून स्वतःचे मोठे भाषा मॉडेल (एलएलएम) विकसित करण्याचे काम करीत आहे, असे त्याचे गट मुख्य कार्यकारी अधिकारी शैलेश कुमार डेव्ह म्हणाले.

सोमवारी (March मार्च) मीडिया राउंडटेबल दरम्यान डेव्हि म्हणाले की कंपनीने एलएलएमला त्याच्या उत्पादनांमध्ये समाकलित करणे आणि “योग्य वेळी” व्यवसायांसाठी उपलब्ध करुन देणे आहे.

झोहो सध्या दोन एआय मॉडेल विकसित करीत आहे – एक सामान्य एलएलएम आणि इंडिक भाषा मॉडेल, विशेषत: भारतीय वापरकर्त्यांसाठी डिझाइन केलेले. यावर्षी सामान्य मॉडेल लाँच करणे अपेक्षित आहे, परंतु इंडिक भाषा मॉडेल सुरू करण्यासाठी कोणतीही टाइमलाइन नाही.

एक मजबूत डेटासेट तयार करण्यासाठी कंपनी आयआयटी, एआय 4bharat आणि कार्या सारख्या डेटा संकलन कंपन्यांसह सहयोग करीत आहे.

भारतीय भाषा उपलब्ध डेटाच्या मिश्रित स्वरूपामुळे अनन्य आव्हाने सादर करतात, बहुतेकदा इंग्रजी शब्द आणि वाक्यांशांनी जोडल्या जातात. यावर लक्ष देण्यासाठी काही उद्योग खेळाडू प्रशिक्षणासाठी सिंथेटिक डेटावर अवलंबून असतात. तथापि, डेव्हि म्हणाली की झोहोने आतापर्यंत सिंथेटिक डेटा वापरला नाही.

“एआय B बारातला सरकारी डेटामध्ये प्रवेश आहे आणि त्याने काही डेटासेट तयार केले आहेत, जे आम्ही आमच्या स्वतःच्या डेटा संकलन प्रयत्नांसह वापरतो. आम्ही हे डेटासेट वापरुन आमच्या मॉडेलला प्रशिक्षण देत आहोत, ”तो म्हणाला.

आयआयटी मद्रासमधील एआय 4bharat ही एक संशोधन प्रयोगशाळा आहे जी भारतीय भाषांसाठी ओपन-सोर्स डेटासेट, साधने, मॉडेल्स आणि अनुप्रयोग विकसित करण्यावर कार्य करते.

इंडिक एलएलएम विकसित करण्याच्या आव्हानांबद्दल बोलताना डेव्हि म्हणाली, “… उपलब्ध डेटा बहुतेक इंग्रजीमध्ये आहे आणि भारतीय भाषांसाठी टोकनिझेशन युरोपियन भाषांपेक्षा बरेच वेगळे आहे. आम्ही सक्रियपणे कार्य करीत असलेले एक आव्हान हे सादर करते. भारतातील बर्‍याच कंपन्या अशाच प्रकारच्या मुद्द्यांचा सामना करीत आहेत, परंतु आम्ही त्यांचे निराकरण करण्यासाठी हात ठेवण्यावर विश्वास ठेवतो. एकदा आम्हाला अर्थपूर्ण प्रगती झाल्यानंतर आम्ही अधिक तपशील सामायिक करू. ”

उल्लेखनीय म्हणजे, सामान्य मॉडेलसाठी, 7 बीएन पॅरामीटर्ससह दोन आवृत्त्या आणि इतर 13 बीएन पॅरामीटर्ससह असतील.

गेनई बूमचा फायदा

हा विकास अशा वेळी आला आहे जेव्हा गेनईने वादळाने जगाला नेले आहे. या दरम्यान, चीनच्या दीपसीकचे यश आहे भारताला स्वतःचे एलएलएम विकसित करण्याची गरज याबद्दल चर्चेला प्रज्वलित केले.

झोहोने दीपसीकच्या पुस्तकातून एक पान काढले आहे आणि उर्जा आणि संसाधन कार्यक्षम एलएलएम विकसित करण्यावर लक्ष केंद्रित केले आहे. “आमच्या एलएलएमसाठी आम्ही ओपनई सारख्या भव्य शक्ती-भुकेलेल्या मॉडेल्सचा विचार करीत नाही. त्याऐवजी, आम्ही शक्य तितक्या कार्यक्षम होण्यासाठी आमच्या एलएलएम आकार देण्यावर लक्ष केंद्रित केले आहे, जसे दीपसीक किंवा त्याहूनही अधिक अनुकूलित आहे. म्हणजे ते जास्त शक्ती किंवा संसाधनांचा वापर करणार नाहीत, ”डेव्हि म्हणाली.

एलएलएमच्या विकासाव्यतिरिक्त, झोहो गेनई बूमचा फायदा घेण्यासाठी “अनुलंबकरण” वर लक्ष केंद्रित करीत आहे.

एआय मॉडेल्स वेगाने कमोडिटींग बनत आहेत, अगदी मेटाच्या लामा आणि मिठी मारणार्‍या फेस मॉडेल्स सारख्या मुक्त-स्रोत मॉडेल्सप्रमाणे. परंतु, झोहोचा असा विश्वास आहे की आयटी अनुप्रयोगांसाठी विशेषत: बारीक-ट्यूनिंग एआय मॉडेल्समध्ये एक मोठी संधी आहे.

कंपनीचा असा विश्वास आहे की पीडीएफएसमध्ये मालवेयर शोधण्यासाठी विसंगती शोधणे, अंदाज, ज्ञान आलेख आणि सुरक्षा अल्गोरिदम यासारख्या बेस्पोक फाउंडेशनल एआय मॉडेल्स विकसित करण्यात त्याची शक्ती आहे.

सध्या, झोहोने 80 पेक्षा जास्त आयटी मूळ, बेस्पोक एआय अल्गोरिदम तैनात केल्याचा दावा केला आहे जे कंपनीच्या एंटरप्राइझ आयटी मॅनेजमेंट डिव्हिजन, मॅनेजिनइजेनमध्ये दरमहा 5 बीएन एपीआय कॉलवर प्रक्रिया करतात. 2023 ते 2024 पर्यंत एआय वापरात वर्षाकाठी 50% वाढ झाल्याचा दावा आहे.

आव्हानांवरील प्रश्नाला उत्तर देताना डेव्ही म्हणाले, “योग्य आकार बदलणे ही एक महत्त्वाची गोष्ट आहे, विशेषत: बी 2 सी वापरल्या गेलेल्या प्रकरणांमध्ये जेथे मॉडेल्सने विस्तृत क्वेरीची पूर्तता केली पाहिजे आणि वापरकर्त्यांनी त्वरित प्रतिसादांची अपेक्षा केली पाहिजे आणि बर्‍याचदा सार्वजनिकपणे आउटपुट सामायिक केले पाहिजे, ज्यामुळे अचूकता आणि कार्यक्षमता गंभीर बनते.”

दरम्यान, गेनईच्या उत्क्रांतीबद्दल भाष्य करताना या गटाचे मुख्य कार्यकारी अधिकारी म्हणाले की, दीपसीक अल्प कालावधीत तयार झाला नाही आणि त्यांच्या कार्यसंघाकडून विस्तृत प्रयोग आणि प्रयत्न आवश्यक आहेत. त्याचा असा विश्वास आहे की पायाभूत मॉडेल कसे तयार करावे हे पुन्हा परिभाषित करण्याची वेळ येते तेव्हा आणखी एक पुनरावृत्ती शिल्लक आहे.

“जेव्हा ते घडते तेव्हा झोहोला ते दत्तक घेण्यास तयार राहण्याची आणि पटकन कृती करण्याची इच्छा असते.”

डेव्हीला अलीकडेच त्याच्या कोफाउंडरनंतर झोहोच्या गटातील मुख्य कार्यकारी अधिकारी यांच्या भूमिकेत बढती देण्यात आली. श्रीधर वेम्बू खाली उतरला जानेवारीत मुख्य वैज्ञानिकांची भूमिका घेण्यासाठी आणि कंपनीच्या आर अँड डी उपक्रमांवर लक्ष केंद्रित करण्यासाठी.

! फंक्शन (एफ, बी, ई, व्ही, एन, टी, एस) {if (f.fbq) रिटर्न; एन = एफ.एफबीक्यू = फंक्शन () {एन.कॅलमेथोड? n.callmethod.apply (एन, युक्तिवाद): n.queue.push (वितर्क)}; जर (! एफ. एन. टी.एसआरसी = व्ही; एस = बी. S.PARENTNODE.INSERTBEFOR (T, s)} (विंडो, दस्तऐवज, 'स्क्रिप्ट', 'एफबीक्यू (' आयएनटी ',' 862840770475518 ');