यामागे सिनेमॅटोग्राफर असल्यासारखे वाटते”: हॉलीवूडला हादरवून टाकणारे नवीन चीनी एआय व्हिडिओ मॉडेल

सारांश

  • सी डान्स 2.0 नावाचे मॉडेल, काही लिखित प्रॉम्प्ट्समधून ध्वनी प्रभाव आणि संवादांसह पूर्ण सिनेमा-गुणवत्तेचे व्हिडिओ तयार करू शकते.
  • क्रिएटिव्ह स्टुडिओ व्हिडिओ स्टेटमधील जॉन विलियम ब्लूम म्हणतात की त्यांनी एआय व्हिडिओंचे वर्णन “एआयसाठी चांगले” म्हणून करणे थांबवण्याची ही पहिलीच वेळ आहे. त्याऐवजी, तो म्हणतो की ते आता वास्तविक स्टुडिओद्वारे बनवलेल्या उत्पादनांपेक्षा वेगळे दिसत आहेत. जेव्हा वेस्टर्न AI व्हिडिओ टूल्स वापरकर्त्याच्या सूचनांचा अर्थ लावण्यात आणि प्रभावी व्हिज्युअल तयार करण्यात सुधारित झाले आहेत, ब्लूमचा असा विश्वास आहे की सी डान्सने एका सीमलेस सिस्टममध्ये अनेक घटक यशस्वीरित्या एकत्र केले आहेत.
  • चिनी कंपन्या पडद्यामागे कोणती प्रगत साधने विकसित करत असतील असा प्रश्न तो विचारतो. मागच्या वर्षी, आणखी एक चिनी एआय मॉडेल, डीपसीकने कमी किमतीच्या भाषेच्या मॉडेलने तंत्रज्ञान जगाला धक्का दिला ज्याने पटकन मागे टाकले.
    Sea Dance 2.0 ने मथळ्यांवर वर्चस्व राखले असताना, इतर प्रमुख चीनी कंपन्यांनी देखील नवीन जनरेटिव्ह एआय टूल्स चांद्र नववर्षाच्या सुट्टीपूर्वी लाँच केले.

AI व्युत्पन्न सारांश

एक नवीन कृत्रिम बुद्धिमत्ता TikTok च्या मूळ कंपनी, Byte डान्सने विकसित केलेल्या मॉडेलने या आठवड्यात हॉलीवूडमध्ये खळबळ उडवून दिली आहे — केवळ ते काय करू शकते म्हणून नव्हे, तर सर्जनशील उद्योगांच्या भविष्यासाठी याचा काय अर्थ असू शकतो.

सी डान्स 2.0 नावाचे मॉडेल, काही लिखित प्रॉम्प्ट्समधून ध्वनी प्रभाव आणि संवादांसह पूर्ण सिनेमा-गुणवत्तेचे व्हिडिओ तयार करू शकते. अलिकडच्या दिवसांमध्ये, स्पायडर-मॅन आणि डेडपूल सारख्या लोकप्रिय पात्रांचे वैशिष्ट्य असलेल्या AI-व्युत्पन्न क्लिप व्हायरल झाल्या आहेत, ज्यामुळे आकर्षण आणि चिंता दोन्ही आहेत.

डिस्ने आणि पॅरामाउंटसह प्रमुख स्टुडिओने त्वरीत बाइट नृत्यावर कॉपीराइट कायद्याचे उल्लंघन केल्याचा आरोप केला. तथापि, या तंत्रज्ञानाच्या सभोवतालच्या चिंता कायदेशीर विवादांच्या पलीकडे आहेत. सीडान्स प्रथम जून 2025 मध्ये सादर करण्यात आला होता परंतु त्या वेळी मर्यादित लक्ष मिळाले. आठ महिन्यांनंतर, त्याच्या श्रेणीसुधारित आवृत्तीने AI-व्युत्पन्न व्हिडिओबद्दलची धारणा नाटकीयरित्या बदलली आहे.

क्रिएटिव्ह स्टुडिओ व्हिडिओ स्टेटमधील जॉन विलियम ब्लूम म्हणतात की त्यांनी एआय व्हिडिओंचे वर्णन “एआयसाठी चांगले” म्हणून करणे थांबवण्याची ही पहिलीच वेळ आहे. त्याऐवजी, तो म्हणतो की ते आता वास्तविक स्टुडिओद्वारे बनवलेल्या उत्पादनांपेक्षा वेगळे दिसत आहेत. जेव्हा वेस्टर्न AI व्हिडिओ टूल्स वापरकर्त्याच्या सूचनांचा अर्थ लावण्यात आणि प्रभावी व्हिज्युअल तयार करण्यात सुधारित झाले आहेत, ब्लूमचा असा विश्वास आहे की सी डान्सने एका सीमलेस सिस्टममध्ये अनेक घटक यशस्वीरित्या एकत्र केले आहेत.

मिड ट्रॅव्हल आणि ओपनएआयच्या सोराप्रमाणे, सी डान्स मजकूर सूचनांमधून व्हिडिओ तयार करतो. काही प्रकरणांमध्ये, ते एकाच प्रॉम्प्टवरून उच्च-गुणवत्तेचे परिणाम वितरीत करण्यास सक्षम दिसते. AI नीतिशास्त्र संशोधक मार्गारेट मिशेल म्हणतात की हे मॉडेल विशेषतः शक्तिशाली आहे कारण ते मजकूर, प्रतिमा आणि ऑडिओ एका एकत्रित आउटपुटमध्ये एकत्रित करते. मॉडेलच्या क्षमतांची चाचणी घेण्यासाठी एक असामान्य बेंचमार्क उदयास आला आहे: ते विल स्मिथ स्पॅगेटी खात असल्याची व्हायरल क्लिप किती खात्रीपूर्वक पुन्हा तयार करू शकते. सी डान्सने केवळ धक्कादायक वास्तववादासह दृश्याची प्रतिकृती बनवली नाही तर स्पॅगेटी राक्षसाशी लढा देत असलेल्या अभिनेत्याच्या व्हायरल क्लिप देखील तयार केल्या आहेत – मोठ्या बजेटच्या चित्रपट निर्मितीसारखे दिसणारे दृश्य.

उद्योग व्यावसायिकांचे म्हणणे आहे की सी डान्स व्हिडिओ जनरेशन तंत्रज्ञानातील एक मोठी झेप दर्शवते. सिंगापूरस्थित ॲनिमेशन स्टुडिओ टायनी आयलंड प्रॉडक्शनचे प्रमुख डेव्हिड केव यांनी नमूद केले की, मॉडेलचे जटिल ॲक्शन सीक्वेन्स त्याच्या स्पर्धकांपेक्षा कितीतरी अधिक वास्तववादी दिसतात. तुम्ही एखाद्या सिनेमॅटोग्राफरसोबत किंवा फोटोग्राफीच्या ॲक्शन फिल्म दिग्दर्शकासोबत काम करत आहात असे वाटते,” तो म्हणतो.

तांत्रिक यश असूनही, सी डान्सला गंभीर कॉपीराइट आव्हानांचा सामना करावा लागत आहे — AI युगातील एक वाढती समस्या. हॉलीवूड संस्थांनी स्पायडर-मॅन आणि डार्थ वॅडर सारख्या कॉपीराइट केलेल्या पात्रांच्या वापरावर तीव्र आक्षेप घेतला आहे. डिस्ने आणि पॅरामाउंट यांनी त्यांच्या बौद्धिक संपत्तीचा वापर थांबवण्याची मागणी करणारी बाइट डान्स बंद करण्याची पत्रे जारी केली आहेत.

ॲनिम-शैलीतील वर्णांचे व्हिडिओ व्हायरल झाल्यानंतर जपानने संभाव्य कॉपीराइट उल्लंघनाची चौकशी सुरू केली आहे.

बाइट डान्सचे म्हणणे आहे की ते विद्यमान सुरक्षा बळकट करण्यासाठी पावले उचलत आहे. तथापि, हा मुद्दा एका चिनी कंपनीपुरता मर्यादित नाही. 2023 मध्ये, द न्यूयॉर्क टाईम्सने OpenAI आणि Microsoft यांच्यावर खटला दाखल केला आणि आरोप केला की त्यांचे लेख AI मॉडेलला प्रशिक्षण देण्यासाठी परवानगीशिवाय वापरण्यात आले. मागील वर्षी Reddit ने Perplexity विरुद्ध कायदेशीर कारवाई दाखल केली आणि दावा केला की त्याने वापरकर्त्याच्या पोस्ट बेकायदेशीरपणे स्क्रॅप केल्या आहेत. डिस्नेनेही गुगलच्या एआय सिस्टीमबद्दल अशीच चिंता व्यक्त केली आहे.

मिशेलने असा युक्तिवाद केला की स्पष्ट सामग्री लेबलिंग आणि AI वर सार्वजनिक विश्वास निर्माण करणे हे वाढत्या वास्तववादी व्हिडिओ बनवण्यापेक्षा अधिक महत्वाचे आहे. ती म्हणते की डेव्हलपर्सनी योग्य परवाना, नुकसान भरपाई आणि गैरवापरासाठी उत्तरदायित्व सुनिश्चित करणारी प्रणाली तयार केली पाहिजे. उदाहरणार्थ, डिस्नेने Star Wars, Pixar आणि Marvel मधील पात्रांना परवाना देण्यासाठी OpenAI च्या Sora सोबत $1 बिलियन करारावर स्वाक्षरी केली.

सागरी नृत्याने चीनच्या जलद AI विकासाकडे पुन्हा एकदा जागतिक लक्ष वेधले आहे.

मेलबर्न विद्यापीठातील संशोधक शानन कोहली सूचित करतात की चीनी मॉडेल्स आता सर्वोत्तम उपलब्ध तंत्रज्ञानाशी थेट स्पर्धा करत आहेत. चिनी कंपन्या पडद्यामागे कोणती प्रगत साधने विकसित करत असतील असा प्रश्न तो विचारतो. मागच्या वर्षी, आणखी एक चिनी एआय मॉडेल, डीपसीकने कमी किमतीच्या भाषेच्या मॉडेलने तंत्रज्ञान जगाला धक्का दिला ज्याने पटकन मागे टाकले.

Sea Dance 2.0 ने मथळ्यांवर वर्चस्व राखले असताना, इतर प्रमुख चीनी कंपन्यांनी देखील नवीन जनरेटिव्ह एआय टूल्स चांद्र नववर्षाच्या सुट्टीपूर्वी लाँच केले.

चीनचे विश्लेषक बिल बिशप यांनी त्यांच्या वृत्तपत्रात नमूद केले आहे की स्प्रिंग फेस्टिव्हल वाढत्या प्रमाणात “AI सुट्टी” बनत आहे, कारण लाखो लोक घरी असतात आणि नवीन ॲप्स वापरण्यासाठी तयार असतात अशा वेळी कंपन्या नवीन उत्पादने प्रकाशित करतात.

आम्ही तुमच्या योगदानाचे स्वागत करतो! तुमचे ब्लॉग्स, मतांचे तुकडे, प्रेस रिलीज, बातम्यांचे पिच आणि बातम्यांची वैशिष्ट्ये मत@minutemirror.com.pk आणि minutemirrormail@gmail.com वर सबमिट करा.

Comments are closed.