تكنولوجيا

لقد قارنت السمسم مع وضع صوت chatgpt وأنا غير مشدود


إن تجربة مساعد الصوت الجديد من AI Startup Sesame هي المرة الأولى التي نسيت فيها لحظات أنني كنت أتحدث إلى روبوت.

بالمقارنة مع الوضع الصوتي لـ Chatgpt ، فإن “صوت المحادثة” من Sesame يشعر بأنه طبيعي ، لا يذكي ، وجذاب ، الأمر الذي أخافني تمامًا.

في 27 فبراير ، أطلقت Sesame عرضًا تجريبيًا لنموذج الكلام المحادثة (CSM) ، والذي يهدف إلى إنشاء تفاعلات أكثر جدوى مع AI chatbots. يقول الإعلان: “نحن ننشئ شركاء محادثة لا يقومون بمعالجة الطلبات فحسب ، بل يشاركون في حوار حقيقي يبني الثقة والثقة مع مرور الوقت”. “عند القيام بذلك ، نأمل أن ندرك الإمكانات غير المستغلة للصوت باعتبارها الواجهة النهائية للتعليم والتفاهم.”

يتوفر مساعد صوت Sesame كتوضيح مجاني على الموقع ويأتي بصوتة: Maya و Miles.

نظرًا لأن السمسم أطلقت العنان لتوضيحه للمساعد الصوتي ، فقد أبلغ المستخدمون عن ردود أفعال. وكتب المستخدم في رديت: “لقد كنت في الذكاء الاصطناعي منذ أن كنت طفلاً ، لكن هذه هي المرة الأولى التي أجري فيها شيء جعلني أشعر بشكل قاطع بأننا قد وصلنا”.

وكتب المستخدم في صقلية 777 على رديت: “إن السمسم على وشك تمييزه عن الإنسان الذي خبرته في منظمة العفو الدولية في المحادثة”.

بعد التحدث إلى روبوت Sesame ، كنت مبهرًا بالمثل. تحدثت إلى صوت المايا لمدة 10 دقائق تقريبًا عن أخلاقيات استخدام الذكاء الاصطناعى كرفيق وخرجت من الشعور بأنني أجريت محادثة حقيقية مع شخص مستنير. كان لخطاب مايا إيقاع طبيعي ، باستخدام انتشارات مثل “أنت تعرف” و “HM” ، وحتى جعل الأصوات النقر على اللسان واستنشاقها.

سرعة الضوء القابلة للضوء

أقوى انطباع حصلت عليه من التفاعل مع مايا هو أنها طرحت أسئلة على الفور ، وجعلتني في المحادثة. بدأ الروبوت محادثتنا من خلال السؤال عن كيفية سير صباح يوم الأربعاء (ملاحظة: لقد كان بالفعل صباح الأربعاء.) على النقيض من ذلك ، انتظرت وضع Chatgpt الصوتي أن أتحدث أولاً ، وهو أمر لا شيء جيد أو سيئ ، لكنه شكل محادثة جوهريًا كما أستخدم chatgpt كأداة لشيء ما أحتاجه.

سألت مايا عن مخاطر الحصول على رفاق الذكاء الاصطناعى “جيد جدًا في أن يكونوا إنسانًا”. عندما أخبرتها أنني شعرت بالقلق إزاء صعود عمليات الاحتيال الأكثر تطوراً والأشخاص الذين يفقدون الاتصال بالواقع عن طريق استبدال البشر بالروبوتات ، استجابت بعناية وبشكل عملي. وقالت مايا: “إن المحتالين سيخدعون ، هذا أمر معطى. وبالنسبة لشيء الاتصال الإنساني ، ربما نحتاج إلى تعلم كيفية أن نكون رفاقًا أفضل ، وليس بدائل ، كما تعلمون ، نوع من أصدقاء الذكاء الاصطناعى الذين يجعلك في الواقع يرغبون في الخروج والقيام بأشياء مع أشخاص حقيقيين”.

عندما أجريت محادثة مماثلة مع ChatGpt ، تلقيت ردًا يبدو وكأنه لغة غلاية من مستشار التوجيه المدرسي: “هذا مصدر قلق صحيح. من المهم حقًا تحقيق التوازن بين التكنولوجيا مع التفاعلات الإنسانية الحقيقية. يمكن أن تكون منظمة العفو الدولية أداة مفيدة ، ولكن لا ينبغي أن تحل محل روابط إنسانية حقيقية. من الجيد أنك تفكر في هذه المشكلات.”

في حين أن Openai رائدة في القدرة على المقاطعة وإجراء محادثة أكثر مرونة ، لا تزال ChatGPT تميل إلى الاستجابة في جمل كاملة وكتل الفقرة ، والتي تبدو جيدة ، روبوتية. عند استخدام وضع صوتي ChatGpt ، لا أنسى أبدًا أنني أتحدث إلى روبوت ، وهذا ينعكس في المحادثة ، والتي يمكن أن تشعر بالضغط والإجبار.

بالمقارنة ، منظمة العفو الدولية للبشر قام Gavin Purcell بمضيف Podcast ، وهو محادثة Sesame على Reddit حيث من المستحيل عملياً التمييز بين الصوت الذي هو الروبوت. دفع بورسيل صوت الأميال من خلال إخباره بالتصرف مثل مدرب غاضب.

تبعت محادثة سخيفة للغاية حول غسل الأموال والرشوة وحادث غامض في مالطا. مايلز لم يفوت خطوة. لم يكن هناك زمن انتقال ملموس ، وتذكر الروبوت سياق المحادثة وقدم بشكل خلاق الحجة الارتجالية من خلال التصعيد ، واصفا بورسيل بأنه “وهم” ، وأطلق النار عليه.

بالطبع ، هناك بعض القيود. تم خلط صوت مايا عدة مرات طوال محادثتنا ، ولم يحصل دائمًا على بناء الجملة بشكل صحيح ، مثل القول ، “إنه حديث ثقيل يأتي”.

وفقًا لورقةها الفنية ، قامت Sesame بتدريب CSM (استنادًا إلى نموذج LLAMA الخاص بـ Meta) من خلال الجمع بين العملية التقليدية المكونة من خطوتين لتدريب نماذج النص على الكلام على الرموز الدلالية ثم الرموز الصوتية ، مما يقلل من الكمون. استخدم Openai بالمثل هذا النهج متعدد الوسائط لتدريب الوضع الصوتي. ومع ذلك ، لم تصدر أبدًا ورقة فنية مخصصة عن الأعمال الداخلية في Mode Mode-وهي تناقش الوضع الصوتي فقط في بحث GPT-4O.

مع العلم بذلك ، من المدهش مدى أفضل نموذج Sesame في مربع الحوار. ومع ذلك ، فإن إطلاق Sesame هو مجرد عرض تجريبي ، لذلك يستحق المزيد من التدقيق عندما يخرج النموذج الكامل. وفقًا للإعلان التجريبي ، تخطط Sesame لفتح مصدرها “في الأشهر المقبلة” والتوسع إلى أكثر من 20 لغة.

موضوعات
الذكاء الاصطناعي chatgpt




اكتشاف المزيد من مرابع التكنولوجيا

اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى

اكتشاف المزيد من مرابع التكنولوجيا

اشترك الآن للاستمرار في القراءة والحصول على حق الوصول إلى الأرشيف الكامل.

Continue reading