شريط الأخبار
الرواشدة يشيد بالحمود: نموذج الخُلق الرفيع عراقجي يعود إلى إسلام أباد آتيا من مسقط الملك لـ وزير الخارجية الكويتي: أمن الخليج أساس لأمن المنطقة والعالم الحنيطي يستقبل رئيس هيئة الأركان للقوات المسلحة العربية الليبية الرواشدة: السلط والبلقاء تمثلان ذاكرة الوطن الحيّة ومحطة مضيئة في السردية الأردنية ( صور ) الأردن يدين محاولة اقتحام مسلح لفعالية حضرها ترمب في واشنطن ما نعرفه عن مطلق النار بحفل عشاء مراسلي البيت الأبيض التربية تنعى الطالبين عبدالله ولمار أبو نواس وفاة وزير التربية الاسبق خالد العمري المهندس أيمن أبو زيتون والسيد علي الزعبي يهنئان الدكتور المهندس عبد الحميد الخرابشة بمناسبة توليه منصب مساعد مدير عام المؤسسة التعاونية الاردنية. بدء محاكمة بشار الأسد غيابيا في دمشق ترامب: لا صلة لإيران بحادث هجوم عشاء مراسلي البيت الأبيض المشتبه به في إطلاق النار يعترف باستهداف مسؤولين في إدارة ترامب إجلاء ترامب من حفل عشاء مراسلي البيت الأبيض بعد دوي إطلاق نار باكستان تترقب عودة عراقجي وترامب مصمّم على "الانتصار" في حرب إيران وزير الخارجية يلتقي بوزير خارجية الكويت في عمّان مستقلة الانتخاب توافق على اسم "حزب الأمة" بديلا للعمل الإسلامي ترجيج رفع اسعار البنزين والسولار في اللأردن خلال أيار ارتفاع حصيلة الشهداء في قطاع غزة إلى 72587 منذ بدء العدوان الإسرائيلي تفاصيل صادمة يكشفها الطب الشرعي في جريمة الكرك

روبوتات الدردشة المتقادمة تظهر علامات على الخرف مثل البشر!

روبوتات الدردشة المتقادمة تظهر علامات على الخرف مثل البشر!
القلعة نيوز:

أظهرت دراسة جديدة أن بعض روبوتات الدردشة الرائدة المعتمدة على الذكاء الاصطناعي تُظهر علامات واضحة على الضعف الإدراكي البسيط.

وكما هو الحال مع البشر، تصبح التأثيرات أكثر وضوحًا مع تقادم روبوتات الدردشة، حيث يكون أداء نماذج اللغة الكبيرة الأقدم هو الأسوأ.

ونُشرت الدراسة في دورية "The BMJ"، وتهدف إلى توضيح أن التكنولوجيا ليست كفء بما يكفي لاستخدامها في المجال الطبي، وخاصة في التشخيص، بحسب تقرير لموقع "فيوتشريزم"، اطلعت عليه "العربية Business".

وقال الباحثون القائمون على الدراسة إن النتائج تتحدى "الافتراض القائل بأن الذكاء الاصطناعي سيحل قريبًا محل الأطباء البشريين، حيث أن الضعف الإدراكي الواضح لدى روبوتات الدردشة الرائدة قد يؤثر على موثوقيتها في التشخيص الطبي".

وكانت روبوتات الدردشة محل الاختبار في هذه الدراسة هي "GPT-4" و"GPT-4o" من شركة "OpenAI"، و"Claude 3.5 Sonnet" من شركة "Anthropic"، و"Gemini 1.0" و"Gemini 1.5" من شركة غوغل.

وأُخضت روبوتات الدردشة هذه لتقييم مونتريال الإدراكي (MoCA)، وهو اختبار مصمم للكشف عن العلامات المبكرة للخرف تشير فيه النقاط الأعلى إلى قدرة إدراك متفوقة.

سجل "GPT-4o" أعلى نتيجة (26 نقطة من أصل 30، وهو ما يكاد يلبي الحد الأدنى لما هو طبيعي)، في حين سجلت روبوتات "Gemini" أدنى نتيجة (16 من أصل 30 نقطة).

وفي حين تفوقت روبوتات الدردشة كلها في معظم أنواع المهام، كان أداء كل منها ضعيفًا في المهام البصرية المكانية والتنفيذية، مثل رسم خط بين أرقام تأخذ شكل دائري بترتيب تصاعدي.

كما ظهر أن رسم ساعة تُظهر وقتًا محددًا أمر صعب للغاية بالنسبة للذكاء الاصطناعي. وأخفق نموذجا "Gemini" تمامًا في مهمة تذكر مأجلة بسيطة إلى حدٍ ما، تتضمن تذكر تسلسل من خمس كلمات.

الحقيقة الدولية – وكالات