हार्वर्ड अभ्यासात, एआयने दोन मानवी डॉक्टरांपेक्षा अधिक अचूक आपत्कालीन खोलीचे निदान दिले

वास्तविक आणीबाणीच्या खोलीच्या केसेससह विविध वैद्यकीय संदर्भांमध्ये मोठ्या भाषेचे मॉडेल कसे कार्य करतात याचे एक नवीन अभ्यास तपासते — जिथे किमान एक मॉडेल मानवी डॉक्टरांपेक्षा अधिक अचूक असल्याचे दिसते.
अभ्यास होता विज्ञान मध्ये या आठवड्यात प्रकाशित आणि हार्वर्ड मेडिकल स्कूल आणि बेथ इस्रायल डेकोनेस मेडिकल सेंटर मधील फिजिशियन आणि संगणक शास्त्रज्ञांच्या नेतृत्वाखालील संशोधन संघाकडून येतो. संशोधकांनी सांगितले की, ओपनएआयचे मॉडेल मानवी डॉक्टरांच्या तुलनेत कसे आहेत हे मोजण्यासाठी त्यांनी विविध प्रयोग केले.
एका प्रयोगात, संशोधकांनी बेथ इस्रायलच्या आपत्कालीन कक्षात आलेल्या ७६ रुग्णांवर लक्ष केंद्रित केले, दोन अंतर्गत औषधोपचार उपस्थित डॉक्टरांनी दिलेल्या निदानांची OpenAI च्या o1 आणि 4o मॉडेल्सद्वारे व्युत्पन्न केलेल्या निदानांशी तुलना केली. या निदानांचे मूल्यांकन इतर दोन उपस्थित डॉक्टरांनी केले, ज्यांना हे माहित नव्हते की कोणते लोक मानवाकडून आले आहेत आणि कोणते AI मधून आले आहेत.
“प्रत्येक डायग्नोस्टिक टचपॉईंटवर, o1 ने एकतर दोन उपस्थित डॉक्टर आणि 4o पेक्षा किंवा बरोबरीने चांगली कामगिरी केली,” अभ्यासात म्हटले आहे की फरक “विशेषत: पहिल्या डायग्नोस्टिक टचपॉईंटवर (प्रारंभिक ER ट्रायज) उच्चारले गेले होते, जेथे रुग्णाबद्दल कमीत कमी माहिती उपलब्ध असते आणि योग्य निर्णय घेण्याची सर्वात निकड असते.”
हार्वर्ड मेडिकल स्कूल मध्ये प्रेस प्रकाशन अभ्यासाविषयी, संशोधकांनी यावर जोर दिला की त्यांनी “डेटा अजिबातच पूर्व-प्रक्रिया केली नाही” — एआय मॉडेल प्रत्येक निदानाच्या वेळी इलेक्ट्रॉनिक वैद्यकीय नोंदींमध्ये उपलब्ध असलेल्या समान माहितीसह सादर केले गेले.
त्या माहितीसह, o1 मॉडेलने 67% ट्रायएज प्रकरणांमध्ये “अचूक किंवा अगदी जवळचे निदान” प्रदान करण्यात व्यवस्थापित केले, एका वैद्याच्या तुलनेत ज्याने 55% वेळेस अचूक किंवा जवळचे निदान केले होते आणि दुसऱ्याच्या तुलनेत 50% वेळा चिन्हांकित केले होते.
“आम्ही AI मॉडेलची अक्षरशः प्रत्येक बेंचमार्कवर चाचणी केली, आणि ते आधीच्या मॉडेल्स आणि आमच्या फिजिशियन बेसलाइन्सला ग्रहण लावले,” अर्जुन मनराई म्हणाले, जे हार्वर्ड मेडिकल स्कूलमध्ये AI लॅबचे प्रमुख आहेत आणि अभ्यासाच्या प्रमुख लेखकांपैकी एक आहेत.
टेकक्रंच इव्हेंट
सॅन फ्रान्सिस्को, CA
|
ऑक्टोबर 13-15, 2026
स्पष्टपणे सांगायचे तर, AI आणीबाणीच्या खोलीत वास्तविक जीवन-किंवा-मृत्यूचे निर्णय घेण्यास तयार आहे असा दावा अभ्यासात करण्यात आलेला नाही. त्याऐवजी, असे म्हटले आहे की निष्कर्ष “वास्तविक-जगातील रुग्ण सेवा सेटिंग्जमध्ये या तंत्रज्ञानाचे मूल्यांकन करण्यासाठी संभाव्य चाचण्यांची तातडीची गरज” दर्शवतात.
संशोधकांनी असेही नमूद केले की त्यांनी केवळ मजकूर-आधारित माहिती प्रदान केल्यावर मॉडेल कसे कार्य करतात याचा अभ्यास केला आणि “विद्यमान अभ्यासातून असे सूचित होते की वर्तमान पाया मॉडेल नॉनटेक्स्ट इनपुटवर तर्क करण्यामध्ये अधिक मर्यादित आहेत.”
ॲडम रॉडमन, एक बेथ इस्रायल डॉक्टर जो अभ्यासाच्या प्रमुख लेखकांपैकी एक आहे, गार्डियनला इशारा दिला की एआय निदानाभोवती “जबाबदारीसाठी सध्या कोणतीही औपचारिक चौकट नाही” आणि रुग्णांना अजूनही “मानवांनी जीवन किंवा मृत्यूच्या निर्णयांद्वारे मार्गदर्शन करावे (आणि) आव्हानात्मक उपचार निर्णयांद्वारे मार्गदर्शन करावे असे वाटते.”
मध्ये अभ्यासाबद्दल एक पोस्टक्रिस्टन पंथागानी, एक आपत्कालीन चिकित्सक, म्हणाले की हा एक “एक मनोरंजक AI अभ्यास आहे ज्यामुळे काही खूप जास्त मथळे निर्माण झाले आहेत,” विशेषत: कारण ते एआय निदानांची तुलना ER डॉक्टरांशी नव्हे तर अंतर्गत औषध चिकित्सकांशी करत होते.
“जर आपण एआय टूल्सची तुलना डॉक्टरांच्या नैदानिक क्षमतेशी करणार आहोत, तर आपण त्या वैशिष्ठ्यांचा अभ्यास करणाऱ्या डॉक्टरांशी तुलना करून सुरुवात केली पाहिजे,” पंथागनी म्हणाले. “मला आश्चर्य वाटणार नाही जर एलएलएम एखाद्या न्यूरोसर्जरी बोर्ड परीक्षेत त्वचाशास्त्रज्ञांना हरवू शकेल, (परंतु) हे जाणून घेणे विशेषतः उपयुक्त गोष्ट नाही.”
तिने असाही युक्तिवाद केला, “एक ईआर डॉक्टर म्हणून प्रथमच रुग्णाला पाहणे, माझे प्राथमिक ध्येय आहे नाही तुमच्या अंतिम निदानाचा अंदाज लावण्यासाठी. माझे प्राथमिक उद्दिष्ट हे ठरवणे आहे की तुमची अशी स्थिती आहे की ज्यामुळे तुमचा जीव जाऊ शकतो.”
ही पोस्ट आणि मथळा अद्ययावत करण्यात आला आहे की अभ्यासातील निदान हे अंतर्गत वैद्यक उपस्थीत डॉक्टरांकडून आले आहे आणि क्रिस्टन पंथागानी यांचे भाष्य समाविष्ट करण्यासाठी.
तुम्ही आमच्या लेखांमधील लिंक्सद्वारे खरेदी करता तेव्हा, आम्ही एक लहान कमिशन मिळवू शकतो. याचा आमच्या संपादकीय स्वातंत्र्यावर परिणाम होत नाही.
Comments are closed.