تكنولوجيا

تطلق Microsoft Phi-3 Mini، وهو نموذج صغير يعمل بالذكاء الاصطناعي


أصدرت Microsoft Phi-3 Mini، وهو إصدار جديد من نموذج الذكاء الاصطناعي خفيف الوزن المصمم لمهام محددة.

وفقًا لورقة البحث التي نُشرت في وقت سابق من هذا الأسبوع، يحتوي Phi-3 Mini على 3.8 مليار معلمة وهو أقل بكثير من النماذج الأخرى مثل OpenAI’s GPT-4، مما يجعله صغيرًا بما يكفي لنشره على الهاتف الذكي. لم تشارك OpenAI عدد المعلمات التي يمتلكها GPT-4 ولكن يُعتقد أنها تحتوي على أكثر من تريليون معلمة لكل Semafor.

أنظر أيضا:

يمكن لـ ChatGPT Plus استغلال الثغرات الأمنية في يوم الصفر – لماذا يجب أن يقلقك هذا

تتطلب نماذج الذكاء الاصطناعي التقليدية كميات هائلة من الطاقة الحاسوبية، وهي مكلفة للغاية ولها بصمة كربونية ضخمة. تعمل شركات مثل Microsoft وGoogle على نماذج أصغر حجمًا وخفيفة الوزن تتعامل مع المهام المشتركة، الأمر الذي من شأنه أن يجعل استضافة نماذجها أكثر استدامة – بالمعنى التشغيلي – وأكثر ملاءمة للهواتف الذكية حيث تميل الصناعة بشدة. تعمل شركة Samsung على تطوير الذكاء الاصطناعي التوليدي من خلال مجموعة من الميزات لأجهزة Galaxy الخاصة بها، كما تضيف Google أيضًا ميزات الذكاء الاصطناعي التوليدي إلى تشكيلة Pixel الخاصة بها، ومن المتوقع أيضًا أن تصدر Apple بعض إعلانات الذكاء الاصطناعي الكبيرة لنظام التشغيل iOS 18.

تتعلق المعلمات بكيفية قدرة النماذج على معالجة التعقيد، وبالتالي كلما زاد عدد المعلمات، زادت قدرة النموذج على التعامل مع الطلبات الواسعة والدقيقة. ولكن بالنسبة للمهام اليومية التي قد يحتاجها المستخدم العادي من نموذج الذكاء الاصطناعي، مثل الترجمة أو المساعدة في صياغة رسالة بريد إلكتروني أو البحث عن مطاعم محلية، فمن المفترض أن يكون النموذج الأصغر حجمًا وخفيف الوزن كافيًا.

سرعة الضوء ماشابل

سجل Phi-3 Mini نتائج مماثلة مقابل نموذج Llama 3 مفتوح المصدر من Meta وGPT-3.5 من OpenAI في المعايير المشتركة مع بعض الاستثناءات. لقد تجاوز Llama 3 وسجل أقل بقليل من GPT 3.5 في فهم اللغة الطبيعية (MMLU) والتفكير المنطقي (HellaSwag) وتغلب على كلا النموذجين في التفكير الحسابي (GSM8K). كما تشير الورقة البحثية، فقد سجلت نقاطًا أقل في الأمور التافهة و”المعرفة الواقعية”، لكن الباحثين يعتقدون أن “مثل هذا الضعف يمكن حله من خلال تعزيزه بمحرك بحث”، مما يعني أنه بمجرد توصيل النموذج بالإنترنت، فلن يكون الأمر بهذه الصعوبة. مشكلة.

قام الباحثون بتدريب Phi-3 Mini على مزيج من “بيانات الويب التي تمت تصفيتها بشدة” والتي تلبي معايير المعلومات التعليمية عالية الجودة، بالإضافة إلى البيانات الاصطناعية، مما يتحدى فكرة أن استخراج كل شيء من الويب هو أفضل طريقة لتدريب النموذج. تم تدريب النموذج أيضًا على… قصص ما قبل النوم، وفقًا لموقع DailyAI، وهو ما يجعل في الواقع منطقيًا للغاية لفهم الطريقة التي يعمل بها العقل البشري. تتمثل الفكرة في اختيار الجودة بدلاً من الكمية باستخدام البيانات المنسقة بحيث يمكن تشغيلها على عدد أقل من المعلمات مع الاحتفاظ بفاعليتها.

Phi-3 Mini متوفر الآن على HuggingFace وAzure وOllama.

المواضيع
الذكاء الاصطناعي مايكروسوفت



اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى