× إشترك في قناتنا على واتساب
أحدث الأخبار

الذكاء الاصطناعي في الطب يواجه حدود التشخيص رغم تطور النماذج الحديثة

صفحة فيسبوك
تابع الآن
إكس (تويتر)
تابع على X
ثريدز
تابع الآن
قناة واتساب
انضم الآن


 كشفت دراسة حديثة أن الذكاء الاصطناعي التوليدي ما يزال بعيداً عن امتلاك القدرات المنطقية اللازمة للاستخدام السريري الآمن، رغم التحسن الملحوظ في أداء روبوتات الدردشة الطبية عند تزويدها ببيانات سريرية مكتملة، إلا أنها لا تزال تفشل في تقديم تشخيص تفريقي مناسب في أكثر من 80% من الحالات، وفقاً لبحث أجراه مستشفى ماساتشوستس العام بريجهام في بوسطن، أحد أكبر أنظمة الرعاية الصحية والبحثية في الولايات المتحدة.

وأوضحت نتائج الدراسة المنشورة في مجلة الجمعية الطبية الأمريكية JAMA Network أن نماذج اللغة الكبيرة لا تزال غير قادرة على الوصول إلى مستوى التفكير السريري المطلوب في بيئة طبية حقيقية، ما يثير تساؤلات حول جاهزيتها للاستخدام داخل المستشفيات دون إشراف متخصصين.

وقال الباحث مارك سوتشي إن نماذج اللغة الكبيرة رغم التطور المستمر لا تزال غير مهيأة للتطبيق في الممارسة السريرية غير الخاضعة للإشراف، مشيراً إلى أن هذه النماذج تعجز عن محاكاة التشخيص التفريقي الذي يعد جوهر الاستدلال الطبي وأحد أهم عناصر ما يعرف بفن الطب.

ويُقصد بالتشخيص التفريقي الخطوة الأساسية التي يعتمد عليها الأطباء للتمييز بين الأمراض المتشابهة في الأعراض، من أجل الوصول إلى الحالة المرضية الصحيحة، وهي مرحلة محورية قبل اتخاذ أي قرار علاجي.

وبحسب ما نقلته قناة يورونيوز الإخبارية، فقد شملت الدراسة تحليل أداء واحد وعشرين نموذجاً من نماذج الذكاء الاصطناعي، من بينها أحدث إصدارات كلود وديب سيك وجيمناي وجي بي تي وجروك، حيث جرى اختبارها على تسع وعشرين حالة سريرية موحدة باستخدام أداة تقييم جديدة تحمل اسم PrIME-LLM.

وقامت هذه الأداة بقياس قدرة النماذج على التعامل مع مراحل التشخيص السريري المختلفة، بدءاً من وضع الاحتمالات الأولية، مروراً بطلب الفحوصات المناسبة، وصولاً إلى التشخيص النهائي وخطة العلاج.

وأشارت الدراسة إلى أن بعض النماذج قد تستخلص معلومات طبية غير دقيقة من مصادر الإنترنت، وهو ما قد يؤثر على جودة الاستنتاجات الطبية التي تقدمها.

ولمحاكاة الواقع الطبي بشكل أدق، زوّد الباحثون النماذج بالمعلومات تدريجياً، بدءاً من بيانات المريض الأساسية مثل العمر والجنس والأعراض، ثم إضافة نتائج الفحوصات والتحاليل بشكل متدرج، في محاولة لقياس كيفية تطور عملية التفكير التشخيصي لديها.

وفي هذا السياق، أوضح الباحثون أن التشخيص التفريقي يمثل خطوة حاسمة قبل الوصول إلى التشخيص النهائي، إلا أن النماذج استمرت في معالجة الحالات حتى عند تعثرها في هذه المرحلة، ما يعكس فجوة واضحة في القدرة على التعامل مع عدم اليقين الطبي.

وأظهرت النتائج أن نماذج الذكاء الاصطناعي حققت أداء جيداً في الوصول إلى التشخيص النهائي عندما تتوفر البيانات كاملة، لكنها كانت ضعيفة بشكل واضح في مرحلة التشخيص التفريقي والتعامل مع الحالات المعقدة أو غير المكتملة المعلومات.

وقالت الباحثة آريا راو إن تقييم النماذج خطوة بخطوة يغير طريقة النظر إليها، ويجعلها أقرب إلى دور الطبيب بدلاً من اعتبارها مجرد أدوات اختبار، مشيرة إلى أن قوتها تظهر عندما تكتمل المعلومات، بينما تتراجع قدراتها في المراحل المبكرة من الحالة الطبية.

وأكد الباحثون أن جميع النماذج فشلت في تقديم تشخيص تفريقي دقيق في أكثر من 80% من الحالات، في حين تراوحت دقة التشخيص النهائي بين 60% وأكثر من 90% حسب النموذج المستخدم، ما يعكس تفاوتاً كبيراً في الأداء بين الأنظمة المختلفة رغم التطور التقني المتسارع.

التعليقات

نستخدم ملفات تعريف الارتباط لضمان حصولك على أفضل تجربة.