كشفت إحدى الدراسات أن ChatGPT لديه "أسلوب تواصل" أفضل من بعض الأطباء، بحسب ما قالت صحيفة The Guardian البريطانية السبت 29 أبريل/نيسان 2023.
وسلّطت النتائج الضوء على إمكانية أن يلعب مساعدو الذكاء الاصطناعي دوراً في مجال الطب بحسب القائمين على الدراسة، حيث قال باحثون إن هذا النوع من المساعدين يمكنه المساعدة في صياغة مسودات تَواصُل الأطباء مع المرضى. وقال الدكتور جون آيرز، من جامعة كاليفورنيا سان دييغو: "هناك فرص هائلة لتطوير الرعاية الصحية باستخدام الذكاء الاصطناعي".
لكن البعض أشاروا إلى أن هذه النتائج لا تعني كون ChatGPT أفضل من الأطباء فعلياً، بل حذروا من تفويض المسؤولية السريرية إلى بوت الدردشة، نظراً لميل البوت إلى إنتاج "حقائق" غير صحيحة.
واستخدمت الدراسة المنشورة في دورية JAMA Internal Medicine العلمية بيانات من منتدى AskDocs على منصة Reddit، حيث ينشر الأعضاء أسئلتهم الطبية ليجيب عنها الأطباء المعتمدون من مجال الرعاية الصحية. وجمع الفريق 195 عينةً عشوائية من تفاعلات المنتدى التي شهدت رد طبيب معتمد على سؤال عام. وجرى بعدها طرح الأسئلة الأصلية على نموذج الذكاء الاصطناعي اللغوي، ChatGPT، وطُلِبَ منه الإجابة. وعكفت بعدها لجنةٌ من المتخصصين في الرعاية الصحية على تقييم الإجابات حسب الجودة والتعاطف، دون أن يعرفوا ما إذا كانت الإجابات صادرةً عن طبيب بشري أم عن ChatGPT.
فضّلت اللجنة ردود ChatGPT على ردود البشر في 79% من الحالات إجمالاً. وصنّفت اللجنة ردود ChatGPT على أنها جيدة أو جيدة للغاية من حيث الجودة في 79% من الحالات، مقارنةً بـ22% من ردود الأطباء. بينما كانت ردود ChatGPT متعاطفة أو متعاطفة جداً في 45% من الحالات، مقارنةً بـ5% فقط من ردود الأطباء.
وقال الدكتور كريستوفر لونغهرست، من مستشفى جامعة كاليفورنيا سان دييغو التعليمي: "تُشير هذه النتائج إلى قدرة أدوات مثل ChatGPT على صياغة مسودة نصيحة طبية مخصصة وعالية الجودة بكفاءة، قبل مراجعتها بواسطة الأطباء، وسنبدأ هذه العملية داخل مستشفى جامعة كاليفورنيا سان دييغو".
وقال أستاذ جامعة باث جيمس دافنبورت، الذي لم يشارك في البحث: "لا تقول الورقة البحثية إن ChatGPT يمكنه أن يحل محل الأطباء، لكنها تدعو -بصورةٍ شرعيةٍ تماماً- إلى البحث أكثر في ما إذا كان بإمكان ChatGPT مساعدة الأطباء في توليد الردود، وكيفية تحقيق ذلك".
بينما أشار البعض إلى أنه ليس من المفاجئ أن يكتب ChatGPT نصوصاً تبدو أكثر تعاطفاً، نظراً لأن بوت الدردشة مُحسَّن ليكون محبوباً على نحوٍ خاص. كما مال بوت الدردشة لتقديم إجابات أطول وأكثر ثرثرة من الأطباء البشر، مما قد يكون له دور في تقييماته الأعلى.
في ما حذر آخرون من الاعتماد على النماذج اللغوية في المعلومات المرتبطة بالحقائق، نظراً لميل تلك النماذج إلى الرد بـ"حقائق" مُختلقة.
وقال الأستاذ أنثوني كون من جامعة ليدز إن استخدام النماذج اللغوية كأداة لصياغة مسودات الردود يمثل "حالة استخدام معقولة في مرحلة التبني المبكر"، ومع ذلك يجب استخدامها بحذر حتى لو كانت ستؤدي دوراً ثانوياً. وأردف: "أظهر البشر أنهم يثقون ثقة مفرطة في ردود الآلة، وخاصةً عندما تكون الردود صحيحةً في أغلب الأحيان. وقد لا يكون الإنسان يقظاً بما يكفي للتحقق من ردود بوت الدردشة طوال الوقت. ويتطلب الأمر الحذر، الذي قد يأتي عبر استخدام ردود اصطناعية خاطئة عشوائياً لاختبار مستوى اليقظة".