كشفت دراسة جديدة أن طريقة تفكير نماذج الذكاء الاصطناعي قد تكون متفائلة أكثر من اللازم. فقد وجد الباحثون أن روبوتات الدردشة المدعومة بالذكاء الاصطناعي، مثل “شات جي بي تي” من “أوبن إيه آي” و”كلود” من “أنثروبيك”، تميل إلى افتراض أن البشر أكثر عقلانية ومنطقية مما هم عليه في الواقع، خاصة في المواقف التي تتطلب تفكيرًا استراتيجيًا.

قد يكون لهذا الفارق بين توقعات الذكاء الاصطناعي لسلوك البشر ومستوى ذكاء البشر الحقيقي تداعيات على قدرة هذه الأنظمة على التنبؤ بالقرارات البشرية في الاقتصاد ومجالات أخرى.

اختبار نماذج الذكاء الاصطناعي

اختبر الباحثون نماذج الذكاء الاصطناعي، بما في ذلك “GPT-40” و”Claude-Sonnet-4″، في إطار نظرية الألعاب الكلاسيكية المعروفة باسم “مسابقة الجمال الكينزية”، التي توضح فكرة توقع تصرفات الآخرين عند اتخاذ قرار. في مسابقة الجمال، يجب على المشاركين التنبؤ بما سيختاره الآخرون للفوز، وليس مجرد اختيار ما يفضلونه شخصيًا.

التفكير العقلاني والتحديات البشرية

يعني اللعب العقلاني نظريًا تجاوز الانطباعات الأولى والتفكير فعليًا في تفكير الآخرين، وهي طبقة عميقة من التفكير الاستراتيجي غالبًا ما يجد البشر صعوبة في التعامل معها عمليًا. لتقييم أداء نماذج الذكاء الاصطناعي، جعل الباحثون هذه الأنظمة تلعب نسخة “خمن الرقم”، حيث يختار كل لاعب رقمًا بين صفر ومئة، ويكون الفائز هو من يكون اختياره أقرب إلى نصف متوسط اختيارات جميع اللاعبين.

نتائج الدراسة

قد مُنحت نماذج الذكاء الاصطناعي أوصافًا لمنافسيها البشر، بدءًا من طلاب السنة الأولى الجامعيين وصولًا إلى خبراء نظرية الألعاب، وطلب منها ليس فقط اختيار رقم، بل شرح سبب اختيارها. قامت النماذج بتعديل أرقامها بناءً على من اعتقدت أنها تواجهه، وافترضت النماذج باستمرار مستوى من التفكير المنطقي لدى البشر لا يُظهره معظم اللاعبين الحقيقيين.

غالبًا ما كانت النماذج “تلعب بذكاء زائد” بناءً على افتراضاتها، فتفشل في الوصول للنتيجة الصحيحة.