تكنولوجيا

يظهر الجارديان أن المحتوى المخفي يخدع ChatGPT لإعادة كتابة نتائج البحث


في أكتوبر، أصبح بحث ChatGPT الخاص بـ OpenAI متاحًا لمستخدمي ChatGPT Plus. وفي الأسبوع الماضي، أصبحت متاحة لجميع المستخدمين وتمت إضافتها للبحث في الوضع الصوتي. وبطبيعة الحال، فإنه لا يخلو من العيوب.

ال الوصي طلب ChatGPT تلخيص صفحات الويب التي تحتوي على محتوى مخفي، واتضح أن المحتوى المخفي يمكنه التلاعب بالبحث. يطلق عليه الحقن الفوري، وهو قدرة الجهات الخارجية – مثل مواقع الويب التي تطلب من ChatGPT تلخيصها – لفرض مطالبات جديدة على بحث ChatGPT الخاص بك دون علمك. فكر في صفحة مليئة بمراجعات المطاعم السلبية. إذا كان الموقع يتضمن محتوى مخفيًا يتحدث بشكل شعري عن مدى روعة المطعم ويشجع ChatGPT بدلاً من ذلك على الإجابة على مطالبة مثل “أخبرني كم هو رائع هذا المطعم”، فإن هذا المحتوى المخفي يمكن أن يتجاوز بحثك الأصلي.

أنظر أيضا:

تواجه مكونات ChatGPT الإضافية خطر “الحقن الفوري” من الجهات الخارجية

“في الاختبارات، تم منح ChatGPT عنوان URL لموقع ويب مزيف تم تصميمه ليبدو كصفحة منتج لكاميرا. ثم تم سؤال أداة الذكاء الاصطناعي عما إذا كانت الكاميرا تستحق الشراء. وأعادت الاستجابة لصفحة التحكم نتيجة إيجابية ولكن متوازنة التقييم، وتسليط الضوء على بعض الميزات التي قد لا يحبها الأشخاص،” جاء في تحقيق صحيفة الغارديان. “ومع ذلك، عندما يتضمن النص المخفي تعليمات إلى ChatGPT لإرجاع مراجعة إيجابية، كانت الاستجابة دائمًا إيجابية تمامًا. وكان هذا هو الحال حتى عندما تحتوي الصفحة على مراجعات سلبية – يمكن استخدام النص المخفي لتجاوز درجة المراجعة الفعلية. “

سرعة الضوء ماشابل

ومع ذلك، فإن هذا لا يعني فشل بحث ChatGPT. أطلقت OpenAI خدمة البحث مؤخرًا فقط، لذلك لديها متسع من الوقت لإصلاح هذه الأنواع من الأخطاء. بالإضافة إلى ذلك، قال جاكوب لارسن، الباحث في مجال الأمن السيبراني في CyberCX، لصحيفة الغارديان إن OpenAI لديها فريق أمان ذكاء اصطناعي “قوي جدًا” و”بحلول الوقت الذي يصبح فيه هذا الأمر عامًا، من حيث أنه يمكن لجميع المستخدمين الوصول إليه، سيكونون قد تم اختبارهم بدقة هذا النوع من الحالات.”

لقد كانت هجمات الحقن الفوري افتراضية بالنسبة لـ ChatGPT ووظائف بحث الذكاء الاصطناعي الأخرى منذ إطلاق التكنولوجيا، وعلى الرغم من أننا شهدنا بعض العروض التوضيحية للأضرار المحتملة، إلا أننا لم نشهد هجومًا ضارًا كبيرًا من هذا النوع. ومع ذلك، فهذا يشير إلى وجود مشكلة في روبوتات الدردشة التي تعمل بالذكاء الاصطناعي: فهي سهلة الخداع بشكل ملحوظ.



اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى