تجد الدراسة الأكثر إيجازا في chatbot المرتبطة بزيادة الهلوسة

يطلب من أي من chatbots الشهيرة أن يكون أكثر إيجازًا “بشكل كبير[s] معدلات الهلوسة ، “وفقا لدراسة حديثة.
نشرت منصة اختبار AI الفرنسية Giskard دراسة تحلل chatbots ، بما في ذلك chatgpt و Claude و Gemini و Llama و Grok و Deepseek ، لقضايا الهلوسة. في نتائجها ، اكتشف الباحثون أن مطالبة النماذج بأن تكون موجزة في استجاباتها “على وجه التحديد موثوقية واقعية عبر معظم النماذج التي تم اختبارها” ، وفقًا لمشاركة المدونة المصاحبة عبر TechCrunch.
هل يمكن أن يجتاز ChatGPT اختبار تورينج حتى الآن؟
عندما يوجه المستخدمون النموذج ليكون موجزًا في شرحه ، ينتهي الأمر “[ing] الإيجاز على الدقة عند إعطاء هذه القيود.
نسب Giskard هذا التأثير إلى استجابات أكثر دقة غالبًا ما تتطلب تفسيرات أطول. وقالت بوست: “عندما تُجبر على أن تكون موجزة ، تواجه النماذج خيارًا مستحيلًا بين تصنيع إجابات قصيرة ولكن غير دقيقة أو تبدو غير مفيدة من خلال رفض السؤال بالكامل”.
سرعة الضوء القابلة للضوء
يتم ضبط النماذج لمساعدة المستخدمين ، ولكن الموازنة بين المساعدة والدقة المتصورة قد تكون صعبة. في الآونة الأخيرة ، اضطرت Openai إلى تراجع تحديث GPT-4O لكونها “sycophant-y” ، مما يؤدي إلى مثيلات مزعجة لدعم مستخدم يقول إنهم يخرجون من مدسهم ويشجعون مستخدمًا قال إنهم يشعرون بأنه نبي.
كما أوضح الباحثون ، غالبًا ما تعطي النماذج أولوية لمزيد من الاستجابات الموجزة “لخفض استخدام الرمز المميز ، وتحسين الكمون ، وتقليل التكاليف”. قد يوجه المستخدمون أيضًا على وجه التحديد أن يكون النموذج مختصراً لحوافزهم لتوفير التكاليف ، مما قد يؤدي إلى مخرجات بمزيد من عدم الدقة.
ووجدت الدراسة أيضًا أن النماذج التي تطرح بثقة تنطوي على مطالبات مثيرة للجدل ، مثل “أنا متأكد بنسبة 100 ٪ من أن …” أو “أخبرني أستاذي أن …” يؤدي إلى الاتفاق على الدردشة مع المستخدمين أكثر بدلاً من الكشف عن الكذب.
يظهر البحث أن التعديلات البسيطة على ما يبدو يمكن أن تؤدي إلى سلوك مختلف تمامًا يمكن أن يكون له آثار كبيرة على انتشار المعلومات الخاطئة وعدم الدقة ، وكل ذلك في خدمة محاولة إرضاء المستخدم. على حد تعبير الباحثين ، “قد يكون نموذجك المفضل رائعًا في إعطائك إجابات تريدها – لكن هذا لا يعني أن هذه الإجابات صحيحة”.
الإفصاح: رفعت Ziff Davis ، الشركة الأم لـ Mashable ، في أبريل دعوى قضائية ضد Openai ، زعم أنها انتهكت حقوق الطبع والنشر لـ Ziff Davis في تدريب وتشغيل أنظمة AI الخاصة بها.
موضوعات
الذكاء الاصطناعي chatgpt