डीपसीक चीनच्या 'टू सेशन'च्या आधी V4 फ्लॅगशिप मॉडेल लाँच करण्यासाठी सज्ज आहे

डीपसीक, चीनच्या बाहेरील एआय क्षेत्रामध्ये एक उगवता तारा आहे, त्याने त्याचे पुढील मोठे मॉडेल रिलीज करण्याची योजना जाहीर केली आहे, असे मानले जाते की ते V4 आहे. हे मॉडेल ओपनएआय आणि अँथ्रोपिकसह सध्याच्या यूएस-आधारित नेत्यांशी हेडऑन टकराव करण्याची तयारी करत असताना हे घडते.
DeepSeek ने नवीन मॉडेलच्या स्पेसिफिकेशन्सची यादी जारी केली नाही, परंतु फेब्रुवारीच्या अखेरीस आलेल्या अहवालानुसार, मॉडेल सध्या अंतिम चाचणी टप्प्यातून जात आहे. 28 फेब्रुवारी रोजी प्रकाशित झालेल्या फायनान्शिअल टाईम्सच्या एका अहवालात, रिलीझ नजीक असल्याचे सांगण्यात आले. मार्च 2026 च्या सुरुवातीपर्यंत, डीपसीकने मॉडेलसाठी रिलीजची तारीख अद्याप जाहीर केलेली नाही.
DeepSeek चे नवीन मॉडेल V3 आणि R1 मालिकेतील एक सातत्य आहे आणि नवीन मॉडेलची दिशा स्पष्ट आहे: ठोस कोडिंग, दीर्घ संदर्भ आणि मल्टीमोडल आउटपुट.
अंतर्गत चाचणी सूचित करते की V4 लांब कोडिंग प्रॉम्प्टसह चांगले कार्य करते. याचा अर्थ असा आहे की ते मोठ्या कोड बेस हाताळू शकते, अवलंबनांचा मागोवा घेऊ शकते आणि असंख्य फायलींमध्ये डीबग करू शकते. हे महत्त्वपूर्ण आहे कारण याचा अर्थ V4 जटिल कोड लिहिणाऱ्या संघांना हाताळू शकते, फक्त साध्या स्क्रिप्ट नाही. खरे असल्यास, V4 क्लॉड आणि ChatGPT सारख्या इतर मॉडेलशी थेट स्पर्धा करू शकते.
V4 चे आणखी एक लक्षणीय वैशिष्ट्य म्हणजे ते लांब संदर्भ हाताळू शकते. सध्याच्या AI मॉडेल्समध्ये ही एक महत्त्वपूर्ण समस्या आहे, कारण ते हजारो लाईन्स लांब असलेल्या प्रॉम्प्ट हाताळू शकत नाहीत. ही एक समस्या आहे कारण सध्याच्या मॉडेल्सना विकासकांना कार्ये लहान, अधिक व्यवस्थापित करण्यायोग्य तुकड्यांमध्ये विभाजित करणे आवश्यक आहे.
DeepSeek चा स्पर्धात्मक फायदा केवळ कामगिरीवर आधारित असू शकत नाही. खर्च नियंत्रित करण्यासाठी डीपसीकची प्रतिष्ठा आहे.
डीपसीक एआय प्लेबुकचे पुनर्लेखन कसे करत आहे?
DeepSeek च्या पूर्वीच्या मॉडेल्सनी चांगल्या कार्यक्षमतेसाठी विरळ लक्ष आणि मजबुतीकरण शिक्षणाचा वापर केला आहे. विरळ लक्ष तंत्र डेटाच्या दीर्घ अनुक्रमांसाठी आवश्यक असलेली गणना कमी करते, गणनेची किंमत कमी करते. सुदृढीकरण शिक्षण हे मॉडेलचे वर्तन सुधारण्यास मदत करते, अगदी सुरुवातीच्या प्रशिक्षणानंतरही.
DeepSeek ने AI गणनेसाठी Nvidia चीपवरील अवलंबित्व कमी करण्यासाठी Huawei सोबत सहकार्य केले आहे. Nvidia उच्च-कार्यक्षमता AI गणनेसाठी बाजारात आघाडीवर आहे, परंतु यूएस नियम NVIDIA चिप्सची चीनी संस्थांना विक्री प्रतिबंधित करतात.
या दृष्टिकोनाचे दोन परिणाम आहेत. प्रथम, ग्राहकांसाठी किंमती कमी राहतात. दुसरे, हे दाखवते की मोठ्या भाषेच्या मॉडेल्सना सर्वात महाग प्रोसेसरची आवश्यकता नसते.
डीपसीकचा त्याच्या उत्पादनांसाठी कमी-प्रोफाइल प्रकाशनांचा इतिहास आहे. V3-0324 आणि R1 रिलीझ सारखे पूर्वीचे रिलीझ हगिंग फेसवर फार धमाल न करता केले गेले.
खोऱ्यातील इतर कंपन्यांनी घेतलेल्या ठराविक दृष्टिकोनापेक्षा हे वेगळे आहे. सामान्यतः, कंपन्या मोठ्या धूमधडाक्यात लॉन्च करतात आणि नंतर पुनरावृत्ती करतात. V4 समान दृष्टीकोन वापरून रिलीझ केले असल्यास, ते प्रथम विकसकांमध्ये आणि नंतर सामान्य लोकांमध्ये रिलीज केले जाऊ शकते.
डीपसीकची कार्यक्षमता वॉल स्ट्रीटला का हादरवत आहे?
डीपसीकने आधीच यूएस मार्केटमध्ये व्यत्यय आणला आहे. मागील रिलीझमध्ये मोठ्या यूएस कंपन्यांनी किमतीच्या एका अंशाने ऑफर केलेल्या कार्यप्रदर्शन क्षमतांच्या जवळ किंवा त्याहून अधिक क्षमता असल्याचे म्हटले होते. यामुळे एआय-संबंधित समभागांसाठी बाजारात काही प्रमाणात अस्थिरता निर्माण झाली.
नवीन मॉडेल तणावाच्या क्षणी येते. अमेरिका आणि चीन दोघेही एआयकडे धोरणात्मक मालमत्ता म्हणून पाहतात. OpenAI आणि Anthropic सारख्या कंपन्या जागतिक दत्तक घेण्यामध्ये आघाडीवर आहेत, परंतु चीनी प्रयोगशाळा आता दाखवतात की ते अंतर कमी करू शकतात.
जर V4 कमी किमतीत कोडिंग सामर्थ्य, दीर्घ संदर्भ आणि मल्टीमोडल समर्थन प्रदान करत असेल, तर ते प्रतिस्पर्ध्यांवर प्रतिसाद देण्यासाठी दबाव टाकेल. एंटरप्राइझ डीलमध्ये अगदी लहान कामगिरीचा फायदा होतो.
डीपसीकला ते बदलण्यासाठी मार्केटवर वर्चस्व ठेवण्याची गरज नाही. त्याला फक्त हे सिद्ध करणे आवश्यक आहे की उच्च श्रेणीतील AI कमी किमतीत आणि भिन्न हार्डवेअरसह चालू शकते. त्यामुळे कंपन्या त्यांच्या AI स्टॅकची योजना कशी बनवतात ते बदलेल.
सध्या, उद्योग पुष्टीकरणाची वाट पाहत आहे. पुढील काही आठवडे डीपसीकचे बहुप्रतिक्षित फ्लॅगशिप दाव्यांची पूर्तता करते की नाही आणि यूएस लॅब कसे उत्तर देणे निवडतात हे दर्शवेल.
Comments are closed.