شريط الأخبار
الحنيطي يلتقي قائد قوات الدفاع الباكستانية في إسلام آباد سوريا.. قصف جوي جديد على مستودعات أسلحة ومخدرات في السويداء مظلوم عبدي: تم التوصل إلى تفاهم مشترك مع دمشق فيما يخص دمج القوى العسكرية ما هو جبل باشان الذي استخدمه الهجري بدل السويداء ؟ إعلام عبري: "الإسرائيلي" تحول إلى شخصية غير مرغوب فيها مصدر عسكري إسرائيلي: سنضطر لمواجهة إيران إذا لم توقفها أميركا الجيش الإسرائيلي يقول إنه قتل عضوا في فيلق القدس الإيراني بلبنان الداخلية السورية: القبض على قيادي ثان في داعش بريف دمشق تحقيق: جنرالات الأسد يرفضون التقاعد ويخططون لتمرد سينفذه 168 ألف مقاتل الأردن استورد نحو 300 ألف برميل نفط من العراق الشهر الماضي ورقة سياسات: 3 سيناريوهات لتطور مشروع مدينة عمرة قوات الاحتلال تطلق الرصاص باتجاه مدنيين سوريين بريف القنيطرة الجنوبي ويتكوف أبلغ الوسطاء أن المرحلة الثانية ستبدأ في يناير وسط أجواء حزينة.. المسيحيون في قطاع غزة يحتفلون بالعيد مصر تدفع بأضخم قوافلها لغزة.. 5900 طن إغاثة تدخل القطاع مستشار الرئيس السوري: الخيارات ضاقت مع قوات سوريا الديمقراطية بتهنئة المسيحيين .. الوزيران السابقان عربيات وداوود يُحرجان دعاة الكراهية ويعيدان تصويب البوصلة الدينية والوطنية نقيب الألبسة: استعدادات كبيرة لموسم كأس العالم عبر تصميمات مبتكرة لمنتخب النشامى نعيمات وعلوان والتعمري ضمن قائمة فوربس الشرق الأوسط 30تحت 30 لعام 2025 مدير تنشيط السياحة: أعياد الميلاد تمثل صورة حضارية مشرقة للعيش المشترك والوئام الديني

روبوتات الدردشة المتقادمة تظهر علامات على الخرف مثل البشر!

روبوتات الدردشة المتقادمة تظهر علامات على الخرف مثل البشر!
القلعة نيوز:

أظهرت دراسة جديدة أن بعض روبوتات الدردشة الرائدة المعتمدة على الذكاء الاصطناعي تُظهر علامات واضحة على الضعف الإدراكي البسيط.

وكما هو الحال مع البشر، تصبح التأثيرات أكثر وضوحًا مع تقادم روبوتات الدردشة، حيث يكون أداء نماذج اللغة الكبيرة الأقدم هو الأسوأ.

ونُشرت الدراسة في دورية "The BMJ"، وتهدف إلى توضيح أن التكنولوجيا ليست كفء بما يكفي لاستخدامها في المجال الطبي، وخاصة في التشخيص، بحسب تقرير لموقع "فيوتشريزم"، اطلعت عليه "العربية Business".

وقال الباحثون القائمون على الدراسة إن النتائج تتحدى "الافتراض القائل بأن الذكاء الاصطناعي سيحل قريبًا محل الأطباء البشريين، حيث أن الضعف الإدراكي الواضح لدى روبوتات الدردشة الرائدة قد يؤثر على موثوقيتها في التشخيص الطبي".

وكانت روبوتات الدردشة محل الاختبار في هذه الدراسة هي "GPT-4" و"GPT-4o" من شركة "OpenAI"، و"Claude 3.5 Sonnet" من شركة "Anthropic"، و"Gemini 1.0" و"Gemini 1.5" من شركة غوغل.

وأُخضت روبوتات الدردشة هذه لتقييم مونتريال الإدراكي (MoCA)، وهو اختبار مصمم للكشف عن العلامات المبكرة للخرف تشير فيه النقاط الأعلى إلى قدرة إدراك متفوقة.

سجل "GPT-4o" أعلى نتيجة (26 نقطة من أصل 30، وهو ما يكاد يلبي الحد الأدنى لما هو طبيعي)، في حين سجلت روبوتات "Gemini" أدنى نتيجة (16 من أصل 30 نقطة).

وفي حين تفوقت روبوتات الدردشة كلها في معظم أنواع المهام، كان أداء كل منها ضعيفًا في المهام البصرية المكانية والتنفيذية، مثل رسم خط بين أرقام تأخذ شكل دائري بترتيب تصاعدي.

كما ظهر أن رسم ساعة تُظهر وقتًا محددًا أمر صعب للغاية بالنسبة للذكاء الاصطناعي. وأخفق نموذجا "Gemini" تمامًا في مهمة تذكر مأجلة بسيطة إلى حدٍ ما، تتضمن تذكر تسلسل من خمس كلمات.

الحقيقة الدولية – وكالات