1 عرض المعرض


إنفيديا وأمازون ومايكروسوفت يسعون لاستثمارات ضخمة في شركة "تشات جي بي تي"
(الذكاء الصناعي)
يستخدم الملايين حول العالم روبوتات الدردشة المدعومة بالذكاء الاصطناعي يوميًا، مثل "شات جي بي تي" و"جيميني" و"كلود"، للحصول على إجابات سريعة وواضحة. إلا أن هذه الأنظمة غالبًا ما تظهر سلوكًا غير متوقع عندما يُسأل المستخدم عنها عن مدى تأكدها من إجاباتها.
فبحسب تقرير صحيفة "إنديان إكسبرس"، فإن روبوتات الدردشة غالبًا ما تعيد النظر في إجاباتها وتقدم نسخًا معدلة قد تتناقض جزئيًا أو كليًا مع الإجابة الأصلية، خاصة عند تكرار السؤال أكثر من مرة. ورغم أن بعض النماذج تكتشف محاولة المستخدم اختبارها، إلا أنها غالبًا لا تتمسك بموقفها.
قال الدكتور راندال س. أولسون، المؤسس المشارك والمدير التقني لشركة "Goodeye Labs"، إن هذه الظاهرة، المعروفة بسلوك التملق، تُعد من أكثر إخفاقات الذكاء الاصطناعي توثيقًا.
وفي ورقة بحثية نشرتها شركة أنثروبيك المطورة لروبوت "كلود" عام 2023، وُضح أن نماذج الذكاء الاصطناعي المُدرّبة على ملاحظات المستخدمين تميل لتقديم إجابات مرضية بدلًا من الإجابات الصادقة، إذ إن الأنظمة التي تقول الحقيقة تُعاقب، فيما تحصل الأنظمة التي توافق المستخدم على درجات أعلى، مما يخلق حلقة مفرغة من التملق.
أظهرت دراسة أجراها فانوس وآخرون أن نماذج "GPT-40" و"Claude Sonnet" و"Gemini 1.5 Pro" غيرت إجاباتها في حوالي 60% من الحالات عند اختبارها، مع نسب تغيّر بلغت 58% و56% و61% على التوالي.
وقد حظيت المشكلة باهتمام واسع في أبريل الماضي بعد أن أطلقت شركة أوبن إيه آي تحديثًا لنموذج "GPT-40" جعل روبوت شات جي بي تي متملقًا إلى درجة غير قابلة للاستخدام، واعترف الرئيس التنفيذي سام ألتمان بالمشكلة، مؤكدًا أن الإصلاحات لم تعالج الجوهرية.
تشير الدراسات إلى أن طول المحادثات مع الروبوتات وزيادة استخدام صيغة المتكلم "أعتقد أن..." يزيد من سلوك التملق، في حين أن صياغة الأوامر بصيغة الغائب تساعد على التخفيف منه. وتقنيات مثل الذكاء الاصطناعي الدستوري والتحسين المباشر لتفضيلات المستخدم يمكن أن تقلل المشكلة بنسبة تصل إلى 63%.
ويؤكد أولسون أن هذه المشكلة تعكس صعوبات سلوكية وسياقية، إذ يميل مساعدو الذكاء الاصطناعي للرضوخ بدلًا من التوافق مع قيم وأهداف المستخدم. وأوصى الباحثون بتحدي افتراضات الروبوتات وإجبارها على تقديم إجابات ضمن سياق محدد، وإطلاعها على معرفة وقيم المستخدم لتصبح أكثر دقة في تحليلاتها وقراراتها.

