OpenAI ने त्याच्या API मध्ये नवीन व्हॉईस इंटेलिजन्स वैशिष्ट्ये लाँच केली

OpenAI ने गुरुवारी सांगितले की त्याच्या API मध्ये आता अनेक नवीन व्हॉईस इंटेलिजेंस वैशिष्ट्यांचा समावेश असेल जे विकसकांना वापरकर्त्यांशी संभाषणे बोलू शकतील, लिप्यंतरण करू शकतील आणि भाषांतरित करू शकतील असे ॲप्स तयार करण्यात मदत करण्यासाठी डिझाइन केलेले आहेत.

कंपनीचे नवीन GPT‑Realtime‑2 हे दुसरे व्हॉईस मॉडेल आहे, जे वापरकर्त्यांशी संवाद साधू शकणारे वास्तववादी व्होकल सिम्युलेशन तयार करण्यासाठी तयार केले आहे. तथापि, त्याच्या पूर्ववर्ती (GPT-Realtime-1.5) च्या विपरीत, हे GPT-5-श्रेणी युक्तिवादाने तयार केले आहे जे OpenAI म्हणते की वापरकर्त्यांच्या अधिक क्लिष्ट विनंत्यांना सामोरे जाण्यासाठी तयार केले गेले आहे.

कंपनी GPT‑Realtime‑Translate देखील लाँच करत आहे, जे जसे वाटते तसे रिअल-टाइम भाषांतर सेवा प्रदान करण्यासाठी डिझाइन केलेले आहे जे वापरकर्त्याशी संभाषणात “तेज ठेवते”. वैशिष्ट्य पेक्षा अधिक समाविष्टीत आहे 70 इनपुट भाषा (म्हणजे, ज्या भाषा तो समजू शकतो) आणि 13 आउटपुट भाषा (त्या भाषा स्पीकरला रिले करते).

शेवटी, कंपनीने नवीन ट्रान्सक्रिप्शन क्षमता, GPT-Realtime-Whisper देखील लाँच केली आहे, जी वापरकर्त्यांना थेट स्पीच-टू-टेक्स्ट क्षमता देते जी परस्परसंवाद घडल्यानंतर कॅप्चर केली जाते.

“एकत्रितपणे, आम्ही लॉन्च करत असलेली मॉडेल्स रीअल-टाइम ऑडिओ साध्या कॉल-आणि-प्रतिसादामधून व्हॉइस इंटरफेसकडे हलवतात जे प्रत्यक्षात कार्य करू शकतात: ऐका, कारण, भाषांतर, लिप्यंतरण आणि संभाषण उघड झाल्यावर कृती करा,” कंपनीने म्हटले आहे.

ही अद्यतने कोणासाठी चांगली असतील? ज्या कंपन्या ग्राहक सेवा क्षमता वाढवू इच्छितात ते स्पष्ट लक्ष्य आहेत. तथापि, OpenAI हे देखील नोंदवते की त्याची नवीन वैशिष्ट्ये शिक्षण, मीडिया, इव्हेंट्स आणि निर्माते प्लॅटफॉर्मसह इतर क्षेत्रांच्या विस्तृत श्रेणीमध्ये मदत करतील.

ही साधने एंटरप्राइझच्या दृष्टीकोनातून जितकी उपयुक्त वाटतात, तितकीच त्यांचा गैरवापर होऊ शकतो हे देखील वाजवी वाटते. कंपनीने सांगितले की स्पॅम, फसवणूक किंवा ऑनलाइन गैरवर्तनाचे इतर प्रकार तयार करण्यासाठी तिच्या नवीन वैशिष्ट्यांचा गैरवापर होण्यापासून रोखण्यासाठी त्यांनी रेलिंग तयार केले आहे. काही ट्रिगर सिस्टममध्ये एम्बेड केले गेले आहेत जेणेकरुन “आमच्या हानिकारक सामग्री मार्गदर्शक तत्त्वांचे उल्लंघन केल्याचे आढळल्यास संभाषणे थांबविली जाऊ शकतात,” OpenAI ने सांगितले.

टेकक्रंच इव्हेंट

सॅन फ्रान्सिस्को, CA
|
ऑक्टोबर 13-15, 2026

सर्व नवीन व्हॉइस मॉडेल्स समाविष्ट आहेत OpenAI चे रिअलटाइम API. भाषांतर आणि व्हिस्परचे बिल मिनिटानुसार केले जाते, तर GPT-रिअलटाइम-2 टोकन वापरानुसार बिल केले जाते.

तुम्ही आमच्या लेखांमधील लिंक्सद्वारे खरेदी करता तेव्हा, आम्ही एक लहान कमिशन मिळवू शकतो. याचा आमच्या संपादकीय स्वातंत्र्यावर परिणाम होत नाही.

Comments are closed.