मायक्रोसॉफ्टचे नवीन एआय ट्रान्सक्रिप्शन मॉडेल Google जेमिनी 3.1 फ्लॅशला मागे टाकते: त्याची किंमत किती कमी आहे ते येथे आहे

मायक्रोसॉफ्टने MAI-Transcribe-1, तिचे तिसरे इन-हाउस विकसित AI मॉडेल जारी केले आहे, जे जगातील सर्वात अचूक ट्रान्सक्रिप्शन मॉडेल असल्याचा दावा करते.
केवळ 3.9 टक्के सरासरी शब्द त्रुटी दरासह, MAI-Transcribe-1 इंग्रजी, फ्रेंच, जर्मन, इटालियन, स्पॅनिश, हिंदी, पोर्तुगीज, चेक, डॅनिश, फिनिश, हंगेरियन, डच, पोलिश, रोमानियन, स्वीडिश, जपानी, कोरियन, चीनी, अरबी, इंडोनेशिया, रशियन, इंडोनेशिया, रशियन, तुर्कस्तान आणि 25 भाषांमध्ये कार्य करते.
मायक्रोसॉफ्टचे नवीन AI मॉडेल 11 प्रमुख भाषांमधील FLUERS इंडस्ट्री-स्टँडर्ड बेंचमार्कमध्ये 1 व्या क्रमांकावर आहे आणि उर्वरित 14 भाषांमधील Whisper-large-v3 च्या पसंतीला मागे टाकले आहे. त्याने 14 पैकी 11 भाषांमध्ये नुकत्याच लाँच केलेल्या Google Gemini 3.1 Flash लाही मागे टाकले आहे. मायक्रोसॉफ्ट फाउंड्रीमध्ये उपलब्ध, कंपनी म्हणते की MAI-Transcribe-1 ची बॅच ट्रान्सक्रिप्शन गती त्याच्या Azure फास्ट ऑफरपेक्षा 2.5x अधिक आहे आणि फक्त $0.36 प्रति तास उपलब्ध आहे.
कंपनी म्हणते की MAI-Transcribe-1 सर्व समर्थित भाषांमध्ये अत्यंत अचूक आहे, ज्यामुळे ते उच्चार-टू-टेक्स्ट वापर प्रकरणांच्या विस्तृत श्रेणीसाठी एक आदर्श पर्याय बनते. हे रिअल-टाइम ट्रान्सक्रिप्शनला समर्थन देत नसले तरी, मायक्रोसॉफ्ट म्हणतो की ते भविष्यातील आवृत्तीमध्ये वैशिष्ट्य जोडेल. MAI-Transcribe-1 सोबत, Microsoft ने दोन नवीन AI मॉडेल्स देखील जारी केले – MAI-Image-2 आणि MAI-Voice-1, जे त्यांच्या नावाप्रमाणेच प्रतिमा आणि ऑडिओ तयार करू शकतात.
टेक जायंट म्हणते की MAI-Voice-1 हे त्याचे फ्लॅगशिप व्हॉईस जनरेशन मॉडेल आहे जे “नैसर्गिक, वास्तववादी उच्चार निर्माण करू शकते, अतिसूक्ष्मतेने समृद्ध, भावनिक श्रेणी आणि अभिव्यक्ती जी स्पीकरची ओळख टिकवून ठेवते”. फक्त 1 सेकंदात 60 सेकंदांचा ऑडिओ निर्माण करण्यास सक्षम, MAI-Voice-1 देखील GPU-कार्यक्षम आहे. हे Copilot Audio Expressions आणि Copilot Podcasts मध्ये उपलब्ध आहे.
MAI-Image-2 साठी, Microsoft म्हणते की ते “कार्यप्रदर्शन आणि गती” वर लक्ष केंद्रित करते आणि Arena.ai लीडरबोर्डवरील शीर्ष 3 मॉडेल कुटुंबात देखील दिसले. मायक्रोसॉफ्टचे एआय मॉडेल्स तितके मोठे किंवा वेगवान नसले तरी, कंपनीला गुगल आणि ओपनएआयच्या मोठ्या भाषेच्या मॉडेल्ससाठी स्वस्त पर्याय म्हणून विकण्याची आशा आहे.
Comments are closed.