قال موقع Axios الأمريكي في تقرير نشره الثلاثاء 29 أغسطس/آب 2023 إن الأطباء يواجهون تساؤلات تتعلق بما يمكن أن يُنظر إليه على أنه معدل نجاح مقبول بالنسبة للتشخيصات التي تعتمد على الذكاء الاصطناعي، وما إذا كانت الثقة في الذكاء الاصطناعي في ظل ظروف بحثية خاضعة للرقابة سوف تصمد في العالم الحقيقي.
إذ إن دراسة جديدة لباحثين في المؤسسة البحثية Mass General Brigham، التي تقع مقارها في مدينة سومرفيل بولاية ماساتشوستس، يختبرون أداء روبوت الدردشة ChatGPT في دراسات الحالة المستمدة من الكتب الدراسية، وجدت أن الذكاء الاصطناعي حقق دقة بنسبة 72% في المجمل، على صعيد اتخاذ القرارات السريرية، بدءاً من تحديد التشخيصات الأولية، ووصولاً إلى التشخيصات النهائية واتخاذ قرارات الرعاية.
إجراء تجربة على أداء الذكاء الاصطناعي في تشخيص الأمراض
مع أن أمريكا تستضيف أراضيها الكثير من نخبة المستشفيات والأطباء على مستوى العالم، فإن الولايات المتحدة أنفقت في عام 2021 حوالي 18% من الناتج المحلي الإجمالي على الرعاية الصحية، أي تقريباً ضعف متوسط الإنفاق في أي من الأنظمة الاقتصادية المتقدمة.
وتعد دراسة مؤسسة Mass General Brigham ضمن أولى الدراسات التي تقيّم قدرات النماذج اللغوية الكبيرة، في النطاق الكامل للرعاية الصحية، بدلاً من تقييمه استناداً إلى تأدية كل مهمة على حدة.
تقيّم الدراسة "دعم القرار عبر روبوت الدردشة ChatGPT من البداية الأولى للعمل مع المريض وخلال سيناريو الرعاية الكامل تقييماً شاملاً"، بما في ذلك إدارة الرعاية ما بعد التشخيص، وذلك حسبما قال مارك سوتشي، المدير التنفيذي في حاضنة الابتكار الخاصة بمؤسسة Mass General Brigham والمشارك في تأليف الدراسة، وذلك خلال حديثه مع موقع Axios.
وكان روبوت الدردشة ChatGPT صائباً في التشخيصات النهائية بنسبة 77%. لكنه في الحالات التي احتاجت إلى "تشخيصات تفريقية" -أي استيعاب جميع الحالات المحتملة التي قد تشير إليها مجموعة محددة من الأعراض- فإن معدل نجاح الروبوت انخفض إلى 60%.
البرنامج قادر على مساعدة الأطباء في تشخيص المرض
وجدت دراسة أخرى أُجريت حول 171 مستشفى في الولايات المتحدة وهولندا، أن أحد نماذج تعلم الآلة، ويسمى ELDER-ICU، نجح في تحديد شدة المرض لدى البالغين الذين أُودعوا وحدة الرعاية المركزة، مما يعني أنه "قادر على مساعدة الأطباء في تحديد مرضى وحدة الرعاية المركزة المسنين، الذين يحتاجون اهتماماً أسبق أو أكثر".
صحيحٌ أن الذكاء الاصطناعي تفوق على المهنيين الطبيين في الاضطلاع ببعض المهام، مثل اكتشاف مرض السرطان من الصور الطبية، لكن كثيراً من الدراسات المتعلقة بالاستخدامات الطبية المحتملة للذكاء الاصطناعي لم تترجم ذلك بعد إلى ممارسة في العالم الحقيقي، ويجادل بعض النقاد بأن دراسات الذكاء الاصطناعي لا تستند إلى الاحتياجات السريرية الحقيقية.
قال سوتشي، إنه برغم تحمسه بسبب نتائج دراسة مؤسسة Mass Brigham، لا يزال هناك الكثير من العمل الذي يجب تأديته "لسد الفجوة بين نموذج تعلم الآلة المفيد والاستخدام الواقعي في الممارسة السريرية".
وأوضح: "نماذج اللغة الكبيرة تحتاج إلى تطويرها على صعيد التشخيصات التفريقية قبل أن تصير مستعدة لتأدية الأدوار الرئيسية"، مضيفاً أن الباحثين يجب عليهم أيضاً أن يبحثوا حول الطريقة التي يمكن من خلالها استخدام الذكاء الاصطناعي لتنفيذ المهام في المستشفيات، التي لا تتطلب تشخيصاً نهائياً، مثل فرز المصابين في غرف الطوارئ.
وقال سوتشي إن روبوت الدردشة ChatGPT بدأ يُظهر قدرات الأطباء حديثي التخرج. ولكن نظراً إلى "عدم وجود نقاط مرجعية واقعية" لمعدلات النجاح بين الأطباء على المستويات المختلفة من الخبرة والأقدمية؛ فإن القدرة على معرفة إذا كان الذكاء الاصطناعي يجسد قيمة مضافة بالنسبة لعمل الأطباء سوف يظل شيئاً معقداً.
وأوضح سوتشي أن السماح باستخدام روبوت ChatGPT أو نماذج الذكاء الاصطناعي المماثلة في المستشفيات، يحتاج إلى الكثير من البحوث المرجعية والإرشادات التشريعية، ويجب أن ترتفع معدلات النجاح على صعيد التشخيصات لتصل إلى ما بين 80% و 90%.