البيانات

عالم من المواضيع والقصص الشيقة

تقنية

تفوّق “ChatGPT” على الأطباء في تشخيص الأمراض!

هل يمكن أن يكون روبوت الدردشة طبيبكَ في يومٍ ما؟ يبدو هذا الاحتمال أقرب مما تتخيل.

في دراسة نُشرت مؤخراً، طُلب من 50 طبيباً تشخيص حالات طبية بناءً على تقارير الحالات، مع تعيين بعضهم عشوائياً لاستخدام “تشات جي بي تي” للمساعدة في اتخاذ قراراتهم.

خلال التجربة، تم تقييم الأطباء المشاركين ليس فقط على صحة تشخيصهم النهائي، بل أيضاً على مدى قدرتهم على شرح خطوات تفكيرهم.

بناءً على هذه المعايير، سجل الأطباء الذين عملوا بمفردهم متوسط 74%، بينما سجل أولئك الذين تعاونوا مع روبوت الدردشة 76%.

لكن كلا المجموعتين تجاوزهما نموذج “تشات جي بي تي” بشكلٍ كبير، حيث سجّل متوسط 90% دون أي تدريب طبي!

الدراسة، التي نُشرت في مجلة JAMA Network Open، كانت محدودة النطاق – حيث فحص الأطباء الخمسون ست دراسات حالة فقط – لكنها مع ذلك لها آثار مذهلة حول دور الذكاء الاصطناعي في المجال الطبي، وربما التحيزات التي يحملها الأطباء البشر.

قال آدم رودمان، أحد مُعدّي الدراسة وهو أخصائي أمراض داخلية في مركز بيت إسرائيل ديكونيس الطبي في بوسطن، في مقابلة على بودكاست “هارد فورك” في صحيفة نيويورك تايمز: “لقد صُدمتُ بالنتائج. كانت فرضيتي أن الأشخاص الذين يستخدمون تشات جي بي تي سيكونون الأفضل. لذا أنا مندهش من هذا”.

كانت هذه الحالات، القائمة على مرضى طبيين حقيقيين، صعبةً عمداً. ومع ذلك، ساد تشات جي بي تي بشكل ساحق. وفقًا لرودمان، قد يكون هذا بمثابة دليلٍ على قدرات نموذج الذكاء الاصطناعي بقدر ما هو دليل على عناد الطبيب البشري.

فقد يكون الأطباء الذين استخدموا تشات جي بي تي، على سبيل المثال، شعروا بمقاومة لرأي روبوت الدردشة الثانوي واعتبروه خاطئاً، مُصرّين على تخمينهم الأول نتيجة لذلك.

عامل آخر قد يُفسّر سبب تخلف الأطباء عن التكنولوجيا هو عدم إلمامهم باستخدامها.

لكن رودمان رفض فكرة أن تشات جي بي تي أكثر كفاءة من الطبيب البشري العادي، قائلاً في البودكاست: “الفرق هو أن الأشخاص الذين جمعوا هذه الحالات، المعلومات، إذا أردت التفكير في المطالبات، كانوا أطباءً خبراء. لقد قمنا بتنظيمها بهذه الطريقة.”

بمعنى آخر، قام المهنيون الطبيون البشر بكل العمل الشاق المتمثل في جمع المعلومات الطبية وعرضها بدقة في تقارير الحالة النهائية – وهو أمر لا يستطيع الذكاء الاصطناعي فعله، على الأقل حتى الآن. فإن إعلان تفوّق الذكاء الاصطناعي على الأطباء يشبه إلى حدٍ ما أخذ الطاهي كل الفضل في وجبة لذيذة بينما استخدم وصفة شخص آخر.

كما صُممت الدراسة في المقام الأول لاختبار مدى فعالية روبوت الدردشة في مساعدة الأطباء، والتي اتضح أنها ليست كثيرة – وليس لإثبات تفوّق الذكاء الاصطناعي. في الواقع، وجدت دراسات مماثلة أن تشات جي بي تي سيءٌ للغاية في تشخيص الحالات.

لكن ما هو مُذهل هو أن التجربة أُجريت قبل عام باستخدام إصدار أقدم من تشات جي بي تي. قد تكون النتائج أكثر إثارة للإعجاب الآن.

قال رودمان: “ربما تكون نماذج الذكاء الاصطناعي أفضل في إجراء التشخيصات من الأطباء البشريين. لكن لا أعتقد أن هذا هو الحال مع GPT-4 Turbo، وهو النموذج الذي تم استخدامه هنا. لكن هذا سيصبح حقيقةً في وقتٍ ما، ونحن نقترب بسرعة من ذلك”