الذكاء الاصطناعي الجديد من Apple: 3 طرق يمكن لـ Siri التغلب بها على ChatGPT
بدت شركة Apple بطيئة في القفز على عربة الذكاء الاصطناعي التوليدي، لكن الأبحاث الجديدة المتعلقة بفهم السياق قد تجعل Siri أفضل من ChatGPT.
كان عملاق التكنولوجيا هادئًا بشكل واضح خلال الصعود السريع لـ ChatGPT والوابل اللاحق من أدوات وميزات الذكاء الاصطناعي التوليدية من شركات مثل Google وMicrosoft وMeta. لكن لدى باحثي شركة Apple نموذجًا جديدًا يمكن أن يمنح Siri ترقية الذكاء الاصطناعي التوليدية التي كان يأملها معجبو Apple.
وبحسب ما ورد تتحدث أبل وجوجل. هل يمكن أن يأتي الجوزاء إلى iPhone؟
وقال الباحثون: “يحتوي الكلام البشري عادةً على إشارات غامضة مثل “هم” أو “ذاك”، والتي يكون معناها واضحًا (للبشر الآخرين) بالنظر إلى السياق”. تقترح الورقة نموذجًا يسمى ReALM (التحليل المرجعي كنمذجة لغة) الذي يعالج مشكلة نماذج اللغة الكبيرة (LLMs) التي لا تكون دائمًا قادرة على فهم السياق عندما يتعلق الأمر بالمراجع التي تظهر على الشاشة والمحادثة والخلفية (مثل التطبيقات أو الميزات التي تعمل في الخلفية) بهدف تحقيق “تجربة حقيقية بدون استخدام اليدين في المساعدين الصوتيين.”
في حين أن ChatGPT جيد جدًا وأنواع معينة من فهم السياق، قال الباحثون إن ReALM يتفوق على GPT-3.5 وGPT-4 (اللذان يعملان على تشغيل الإصدارات المجانية والمدفوعة من ChatGPT) في جميع اختبارات السياق الخاصة به. إليك ما يمكن أن يعنيه ذلك بالنسبة لسيري.
1. أدلة السياق التي تظهر على الشاشة
قام باحثو Apple بتدريب ReALM باستخدام البيانات “التي تظهر على الشاشة” من صفحات الويب، بما في ذلك معلومات الاتصال، مما يمكّن النموذج من فهم النص داخل لقطات الشاشة (على سبيل المثال، العناوين وتفاصيل الحساب المصرفي). في حين أن GPT-4 يمكنه أيضًا فهم الصور، إلا أنه لم يتم تدريبه على لقطات الشاشة، وهو ما تقول الورقة إنه يجعل ReALM أفضل في فهم المعلومات التي تظهر على الشاشة والتي قد يطلب مستخدمو Apple المساعدة من Siri فيها.
2. فهم المحادثة والخلفية
مراجع المحادثة تعني شيئًا ذا صلة بالمحادثة، ولكن ربما لم يتم ذكرها صراحةً في المطالبة. من خلال تدريب ReALM على بيانات مثل قوائم الشركات، يمكن للنموذج فهم المطالبات مثل “اتصل بالصيدليات السفلية” في إشارة إلى قائمة الصيدليات القريبة المعروضة على الشاشة، دون الحاجة إلى تقديم تعليمات أكثر تحديدًا.
ReALM قادر على فهم “كيانات الخلفية”، وهو ما يعني شيئًا يعمل في خلفية الجهاز “وقد لا يكون بالضرورة جزءًا مباشرًا مما يراه المستخدم على شاشته أو تفاعله مع الوكيل الافتراضي”، مثل تشغيل الموسيقى أو انطلاق إنذار.
3. على الجهاز بالكامل
أخيرًا وليس آخرًا، تم تصميم ReALM ليكون موجودًا على الجهاز، وهو ما سيكون أمرًا كبيرًا نظرًا لأن LLMs تتطلب الكثير من قوة الحوسبة وبالتالي فهي تعتمد في الغالب على السحابة. بدلاً من ذلك، يعد ReALM بمثابة LLM أصغر، “لكن تم ضبطه بشكل محدد وصريح لمهمة التحليل المرجعي.” لقد روجت شركة Apple تاريخيًا لالتزامها بالخصوصية كنقطة بيع لأجهزتها، لذا فإن إصدار الذكاء الاصطناعي التوليدي من Siri الذي يعمل بالكامل على الجهاز سيكون مرتبطًا جدًا بالعلامة التجارية وإنجازًا كبيرًا للأجهزة التي تتمتع بقدرات الذكاء الاصطناعي.
لقد التزمت شركة Apple الصمت بشأن خططها المتعلقة بالذكاء الاصطناعي، لكن الرئيس التنفيذي تيم كوك قال إنه من المتوقع إعلان كبير عن الذكاء الاصطناعي في وقت لاحق من هذا العام، لذلك تتجه الأنظار إلى مؤتمر Apple للمطورين العالمي (WWDC) في 10 يونيو.
المواضيع
الذكاء الاصطناعي لشركة أبل
اكتشاف المزيد من مرابع التكنولوجيا
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.