يقال إن مقاولي Google Gemini أجبروا على تقييم الردود التي لا يعرفون عنها

مثل أي نموذج genAI، يمكن أن تكون استجابات Google Gemini غير دقيقة في بعض الأحيان، ولكن في هذه الحالة قد يكون السبب هو أن المختبرين ليس لديهم الخبرة اللازمة للتحقق من صحتها.
وفقًا لـ TechCrunch، فإن الشركة التي تم تعيينها لتحسين دقة Gemini تجعل مختبريها يقومون الآن بتقييم الاستجابات حتى لو لم يكن لديهم “المعرفة بالمجال”.
تضيف Google Deep Research إلى Gemini لتصفح الويب نيابةً عنك
يثير التقرير تساؤلات حول الصرامة والمعايير التي تقول Google إنها تطبقها على اختبار Gemini للتأكد من دقتها. في قسم “البناء بمسؤولية” من إعلان Gemini 2.0، قالت Google إنها “تعمل مع مختبرين موثوقين وخبراء خارجيين وتجري تقييمات شاملة للمخاطر وتقييمات للسلامة والضمان”. هناك تركيز معقول على تقييم الاستجابات للمحتوى الحساس والضار، ولكن يتم إيلاء اهتمام أقل للاستجابات التي ليست بالضرورة خطيرة ولكنها غير دقيقة.
سرعة الضوء ماشابل
ويبدو أن جوجل تتجاهل مشكلة الهلوسة والخطأ من خلال إضافة إخلاء المسؤولية ببساطة بأن “الجوزاء يمكن أن يرتكب أخطاء، لذا تحقق مرة أخرى من ذلك”، وهو ما يعفيها فعليًا من أي مسؤولية. لكن هذا لا يفسر قيام البشر بالعمل خلف الكواليس.
في السابق، أصدرت شركة GlobalLogic، وهي شركة تابعة لشركة Hitachi، تعليمات لمهندسيها ومحلليها الفوريين بتخطي استجابة Gemini التي لم يفهموها تمامًا. “إذا لم تكن لديك خبرة مهمة (مثل البرمجة والرياضيات) لتقييم هذه المطالبة، فيرجى تخطي هذه المهمة”، كما جاء في الإرشادات التي اطلع عليها المنفذ.
لكن في الأسبوع الماضي، غيرت شركة GlobalLogic تعليماتها، قائلة: “لا ينبغي عليك تخطي الموجهات التي تتطلب معرفة متخصصة بالمجال”، وبدلاً من ذلك “قم بتقييم أجزاء الموجه التي تفهمها”، ولاحظ أنهم ليس لديهم الخبرة المطلوبة في هذا المجال. تحليلهم. وبعبارة أخرى، لا يتم التعامل مع الخبرة كشرط أساسي لهذا العمل.
يمكن للمقاولين الآن فقط تخطي المطالبات التي “تفتقد المعلومات تمامًا”، وفقًا لـ TechCrunch، أو تلك التي تحتوي على محتوى حساس يتطلب نموذج موافقة.
المواضيع
الذكاء الاصطناعي جوجل