شريط الأخبار
عراقجي يغادر إسلام آباد إلى موسكو الخارجية الإيرانية: عراقجي غادر باكستان إلى روسيا السلط يهزم البقعة بثلاثية في دوري المحترفين توافق أردني كويتي على عقد مشاورات سياسية بين البلدين قريبا (المهندسين) توصي بوقف إصدار التراخيص الإنشائية في المنطقة المحيطة بانزلاق صافوط بيان من عشيرة أبو نواس حول جريمة الكرك المستقلة للانتخاب: لا نتدخل في برامج الأحزاب مثّل الكويت في أكثر من 100 مباراة دولية.. سحب الجنسية من الحارس نواف الخالدي الحسين إربد يتعثر أمام شباب الأردن ويؤجل حسم لقب دوري المحترفين الحمود يرد على الرواشدة : انت مدرسة للخلق والتواضع قرارات لمجلس الوزراء لدعم القطاعات الاقتصاديَّة وتحفيز الاستثمار والتوسُّع في دعم الطَّلبة الجامعيين وتطوير القطاع العام الرواشدة يشيد بالحمود: نموذج الخُلق الرفيع عراقجي يعود إلى إسلام أباد آتيا من مسقط الملك لـ وزير الخارجية الكويتي: أمن الخليج أساس لأمن المنطقة والعالم الحنيطي يستقبل رئيس هيئة الأركان للقوات المسلحة العربية الليبية الرواشدة: السلط والبلقاء تمثلان ذاكرة الوطن الحيّة ومحطة مضيئة في السردية الأردنية ( صور ) الأردن يدين محاولة اقتحام مسلح لفعالية حضرها ترمب في واشنطن ما نعرفه عن مطلق النار بحفل عشاء مراسلي البيت الأبيض التربية تنعى الطالبين عبدالله ولمار أبو نواس وفاة وزير التربية الاسبق خالد العمري

روبوتات الدردشة المتقادمة تظهر علامات على الخرف مثل البشر!

روبوتات الدردشة المتقادمة تظهر علامات على الخرف مثل البشر!
القلعة نيوز:

أظهرت دراسة جديدة أن بعض روبوتات الدردشة الرائدة المعتمدة على الذكاء الاصطناعي تُظهر علامات واضحة على الضعف الإدراكي البسيط.

وكما هو الحال مع البشر، تصبح التأثيرات أكثر وضوحًا مع تقادم روبوتات الدردشة، حيث يكون أداء نماذج اللغة الكبيرة الأقدم هو الأسوأ.

ونُشرت الدراسة في دورية "The BMJ"، وتهدف إلى توضيح أن التكنولوجيا ليست كفء بما يكفي لاستخدامها في المجال الطبي، وخاصة في التشخيص، بحسب تقرير لموقع "فيوتشريزم"، اطلعت عليه "العربية Business".

وقال الباحثون القائمون على الدراسة إن النتائج تتحدى "الافتراض القائل بأن الذكاء الاصطناعي سيحل قريبًا محل الأطباء البشريين، حيث أن الضعف الإدراكي الواضح لدى روبوتات الدردشة الرائدة قد يؤثر على موثوقيتها في التشخيص الطبي".

وكانت روبوتات الدردشة محل الاختبار في هذه الدراسة هي "GPT-4" و"GPT-4o" من شركة "OpenAI"، و"Claude 3.5 Sonnet" من شركة "Anthropic"، و"Gemini 1.0" و"Gemini 1.5" من شركة غوغل.

وأُخضت روبوتات الدردشة هذه لتقييم مونتريال الإدراكي (MoCA)، وهو اختبار مصمم للكشف عن العلامات المبكرة للخرف تشير فيه النقاط الأعلى إلى قدرة إدراك متفوقة.

سجل "GPT-4o" أعلى نتيجة (26 نقطة من أصل 30، وهو ما يكاد يلبي الحد الأدنى لما هو طبيعي)، في حين سجلت روبوتات "Gemini" أدنى نتيجة (16 من أصل 30 نقطة).

وفي حين تفوقت روبوتات الدردشة كلها في معظم أنواع المهام، كان أداء كل منها ضعيفًا في المهام البصرية المكانية والتنفيذية، مثل رسم خط بين أرقام تأخذ شكل دائري بترتيب تصاعدي.

كما ظهر أن رسم ساعة تُظهر وقتًا محددًا أمر صعب للغاية بالنسبة للذكاء الاصطناعي. وأخفق نموذجا "Gemini" تمامًا في مهمة تذكر مأجلة بسيطة إلى حدٍ ما، تتضمن تذكر تسلسل من خمس كلمات.

الحقيقة الدولية – وكالات