एलोन मस्क अलीबाबाच्या नवीन क्वेन 3.5 मुळे हैराण झाले आहेत: 9B मॉडेल त्याच्या आकारमानापेक्षा 10x एआय दिग्गजांना का मागे टाकत आहे

जगभरातील एआय कंपन्या सतत नवीन, मोठ्या आणि अधिक शक्तिशाली मॉडेल्सवर काम करत आहेत, परंतु चीनी टेक जायंट अलीबाबा याच्या उलट मार्गाने जात असल्याचे दिसते. अलीकडेच, कंपनीने त्याच्या Qwen 3.5 सीरीज अंतर्गत चार नवीन लहान मॉडेल्सचे अनावरण केले.

Qwen 3.5-0.8B, 2B, 4B, आणि 9B सह हे मुक्त-स्रोत मोठ्या भाषेचे मॉडेल, मजबूत तर्क कार्यक्षमतेसह मल्टीमोडल क्षमता शोधणाऱ्या विकासकांसाठी आहेत.

अलीबाबा म्हणतो की Qwen 3.5 मालिकेतील चारही मॉडेल्स एकाच आर्किटेक्चरवर बांधले गेले आहेत आणि ते मजकूर आणि प्रतिमा दोन्ही सहजपणे हाताळू शकतात. मालिकेतील प्रत्येक मॉडेलसाठी, कंपनीने एक 'बेस' आवृत्ती जारी केली आहे जी विकसक सुरवातीपासून छान-ट्यून करू शकतात, त्यासोबत 'सूचना' आवृत्ती त्वरित तैनात केली जाऊ शकते.

तथापि, या मालिकेतील सर्वात मोठे आणि सर्वात शक्तिशाली – Qwen 3.5-9B सर्वात जास्त लक्ष वेधून घेत आहे. बेंचमार्कच्या संदर्भात, अलिबाबा म्हणतो की मोठ्या भाषेचे मॉडेल दोन्हीमधील आकार फरक असूनही GPT-oSS-120B प्रमाणेच कार्य करते. चायनीज टेक जायंटचा असाही दावा आहे की मॉडेलचे कार्यप्रदर्शन चॅटजीपीटी आणि जेमिनी सारख्या एआय चॅटबॉट्सशी अनेक तर्क आणि ज्ञान-आधारित चाचण्यांमध्ये तुलना करता येते. तार्किक तर्क, गणित समस्या सोडवणे आणि दस्तऐवज विश्लेषण यांचा समावेश असलेल्या कार्यांमध्ये, Qwen 3.5-9B या मोठ्या AI चॅटबॉट्स प्रमाणेच कार्य करते.

स्पेक्ट्रमच्या दुसऱ्या बाजूला, Qwen 3.5-0.8B आणि 2B, दोन हलके मॉडेल जे लॅपटॉप आणि स्मार्टफोन्स सारख्या पोर्टेबल डिव्हाइसेसवर चालण्यासाठी डिझाइन केलेले आहेत, जेथे संगणकीय शक्ती सर्वोत्तम मर्यादित आहे. आणि ते तर्कशास्त्रात इतर क्वेन मॉडेल्ससारखे मजबूत नसले तरी, अलिबाबा म्हणतात की ते मजकूर आणि प्रतिमा दोन्हीवर सहज प्रक्रिया करू शकतात.

नवीन Qwen 3.5 मालिका मॉडेल हगिंग फेसवर तसेच ओपन वेटसह मॉडेलस्कोपवर उपलब्ध आहेत आणि लोकप्रिय AI फ्रेमवर्क वापरून स्थानिक पातळीवर डाउनलोड आणि चालवता येतात. एका ट्विटला उत्तर देताना, xAI प्रमुख एलोन मस्क यांनी म्हटले आहे की नवीन Qwen 3.5 मालिका मॉडेल्समध्ये “प्रभावी बुद्धिमत्ता घनता” आहे.

Comments are closed.