Google मिथुन एआय आता ऑडिओ फायलींचे प्रतिपादन करू शकते: ते कसे कार्य करते?

Google च्या मिनीमिनी एआय सहाय्यकाने एक मोठे अद्यतन सादर केले आहे जे वापरकर्त्यांना ट्रान्सक्रिप्शन, सारांश आणि मुख्य माहिती काढण्यासाठी ऑडिओ फायली अपलोड करण्याची परवानगी देते. नवीन वैशिष्ट्य 10 मिनिटांपर्यंतच्या रेकॉर्डिंगवर प्रक्रिया करते, ज्यात व्हॉईस मेमो, व्याख्याने, मीटिंग्ज आणि मुलाखती, त्यांना मिथुन प्लॅटफॉर्ममधील शोधण्यायोग्य कागदपत्रांमध्ये रूपांतरित करतात. मानक फाइल-अपलोड इंटरफेसद्वारे वेब आणि मोबाइल दोन्ही अ‍ॅप्सवर उपलब्ध, हे साधन जेमिनी लाइव्हपेक्षा वेगळे आहे, जे विश्लेषणासाठी पूर्व-रेकॉर्ड केलेल्या ऑडिओवर लक्ष केंद्रित करून रिअल-टाइम व्हॉईस कमांडस हाताळते.

मिथुन एआय उच्च अचूकता आणि कार्य एक्सट्रॅक्शनसह ऑडिओ अपलोडची ओळख करुन देते

मिथुनचे गुगलचे व्हीपी जोश वुडवर्ड यांनी स्पष्ट केले की ऑडिओ अपलोड सर्वात जास्त आहे विनंती केली वैशिष्ट्य, सुव्यवस्थित ऑडिओ हाताळणीची जोरदार मागणी प्रतिबिंबित करते. चाचणीत विविध स्वरूपात उच्च ट्रान्सक्रिप्शनची अचूकता दर्शविली गेली, जसे की विनोदी रेखाटने आणि फोन कॉल, जरी नावाच्या ओळखात अधूनमधून त्रुटी आली. जेमिनीने कार्ये काढण्याची, करण्याच्या याद्या व्युत्पन्न करण्याची आणि अपलोड केलेल्या रेकॉर्डिंगमधून मुख्य घटक हायलाइट करण्याची क्षमता देखील दर्शविली, ज्यामुळे ते वैयक्तिक आणि व्यावसायिक दोन्ही कार्यप्रवाहांसाठी उपयुक्त ठरले.

अ‍ॅप कनेक्शन, कार्ड-आधारित इंटरफेसची चाचणी आणि विस्तारित वैयक्तिकरण साधनांसह जेमिनीच्या वाढत्या संचावर अद्यतन तयार करते. त्या तुलनेत, ओपनईच्या चॅटजीपीटी सारखे प्रतिस्पर्धी ट्रान्सक्रिप्शनसाठी व्हिस्पर मॉडेलचा फायदा घेतात, अँथ्रॉपिकचा क्लॉड काही विकसक वातावरणात ऑडिओला समर्थन देतो आणि पेरक्सिटी YouTube वरून डेटा काढतो. जेमिनीचे उद्दीष्ट आहे की विस्तृत प्रेक्षकांमध्ये दररोजच्या उपयोगितावर जोर देऊन स्वत: ला वेगळे करणे.

मिथुन एआय प्रगत प्रक्रिया आणि अभ्यास साधनांसह ऑडिओ क्षमता विस्तृत करते

ट्रान्सक्रिप्शनच्या पलीकडे, मिथुन प्रगत ऑडिओ डेटा प्रक्रिया प्रदान करते. वापरकर्ते सरलीकृत भाषा आउटपुटची विनंती करू शकतात, स्पीकर-विशिष्ट शेरा वेगळ्या करतात, प्रश्न व्युत्पन्न करू शकतात किंवा रेकॉर्ड केलेल्या सामग्रीमधून अभ्यास मार्गदर्शक तयार करू शकतात. ही वैशिष्ट्ये ऑडिओला कृती करण्यायोग्य अंतर्दृष्टीमध्ये पुनरुत्पादित करण्यासाठी लवचिक पर्याय ऑफर करतात.

तथापि, मर्यादा शिल्लक आहेत. 10-मिनिटांची कॅप लांब रेकॉर्डिंग प्रतिबंधित करते आणि विनामूल्य-स्तरीय वापरकर्त्यांना दररोज वापराच्या मर्यादेचा सामना करावा लागतो, संभाव्यत: जड वापरकर्त्यांना अडथळा आणतो. Google ने मोठ्या प्रमाणात प्रक्रियेसाठी किंमती उघडकीस आणली नाहीत, जरी सेवा मानक मिथुन कोटा वापरते, ज्यासाठी मनापासून संसाधन व्यवस्थापन आवश्यक आहे.

सारांश:

Google चे मिथुन एआय आता ट्रान्सक्रिप्शन, सारांश आणि कार्य एक्सट्रॅक्शनसाठी 10 मिनिटांपर्यंत ऑडिओ फायली अपलोड करण्यास समर्थन देते. वैशिष्ट्य विविध रेकॉर्डिंगवर अचूक प्रक्रिया करते, करण्याच्या याद्या तयार करते आणि स्पीकर अलगाव आणि अभ्यास मार्गदर्शक निर्मितीसारख्या प्रगत साधने ऑफर करते. मर्यादांमध्ये अपलोड कालावधी, दैनिक फ्री-टियर कोटा आणि मोठ्या प्रमाणात वापरासाठी अस्पष्ट किंमत समाविष्ट आहे.

प्रतिमा स्रोत


Comments are closed.