تكنولوجيا

أنشأ الباحثون نموذج التفكير الذكري على قدم المساواة مع Openai’s O1 بأقل من 50 دولارًا


فتحت بوابات الفيضان لبناء نماذج التفكير الذكاء على الرخيصة.

طور الباحثون في جامعة ستانفورد وجامعة واشنطن نموذجًا يؤدي نسبيًا لنماذج Openai O1 و Deepseek R1 في الرياضيات والترميز – بأقل من 50 دولارًا من أرصدة حساب السحابة.

ما هو أكثر من ذلك ، تم تدريب النموذج على 1000 سؤال فقط ، واستغرق 26 دقيقة فقط و 16 NVIDIA H100 وحدات معالجة الرسومات. وقال باحث ستانفورد نيكلاس مولينغوف في رسالة بريد إلكتروني إلى Mashable أن التكلفة هي تقدير يعتمد على وقت تشغيل GPU وعدد وحدات معالجة الرسومات H100 المستخدمة.

انظر أيضا:

تعرف على Qwen 2.5 من Alibaba ، وهو نموذج منظمة العفو الدولية يدعي التغلب على كل من Deepseek و Openai’s Chatgpt

إن صناعة الذكاء الاصطناعى في الآونة الأخيرة تدور حول كيفية توفير الأساليب الجديدة لعملية التدريب قبل وبعد تكاليف الحوسبة بشكل كبير ، كما يتضح من تأثير Deepseek التخريبي. علاوة على ذلك ، يمكن للمطورين الآن البناء على رأس نماذج الذكاء الاصطناعى الحالية بتكلفة ضئيلة أو معدومة ، من خلال واجهات برمجة التطبيقات ، وصول مفتوح المصدر ، وحتى نماذج المصدر المغلقة عن طريق تقطير بياناتهم ، مما يؤدي إلى انخفاض التكاليف أكثر.

سرعة الضوء القابلة للضوء

وفقًا لورقة الأبحاث الخاصة بالفريق التي تم نشرها يوم الجمعة الماضي ، تم تدريب S1 على مجموعة بيانات تتكون من “1000 سؤال برعاية بعناية مقترنة بآثار التفكير والإجابات المقطوعة من التفكير الجوزاء التجريبي.” يمكن الوصول إلى النموذج التجريبي للتفكير الجوزاء من Google مع الحدود اليومية من خلال استوديو الذكاء الاصطناعي. في حين أنه نموذج مغلق المصدر ، من الواضح أنه لم يمنع الباحثين من الاستفادة من ردوده.

انظر أيضا:

يقوم Openai بإطلاق وكيل AI “البحث العميق” للدردشة

بعد ذلك ، استخدم الباحثون نموذجًا “Off the Shelf” المملوك من مختبر Alibaba المملوك ، Qwen ، وقاموا بصحها الخاضع للإشراف لمجموعة البيانات المنسقة. بعد ذلك ، أنشأ الفريق ميزانية رمزية للتحكم في مقدار وقت حساب لاختبار النموذج. إذا تجاوزت S1 الميزانية على الرموز المميزة للتفكير ، فقد تم قطعها وأجبرت على توليد أي إجابة ظهرت بها. إذا أراد الباحثون أن ينفق النموذج المزيد من “حساب وقت الاختبار” على مشكلة ، فسيخبرون النموذج ببساطة بـ “الانتظار” ، الذي مدد وقت تفكيره وأدى إلى نتائج أكثر دقة.

من خلال التحكم في مقدار الوقت والحساب الذي يقضيه على مشكلة ما ، تمكن الباحثون من إظهار مدى زيادة فريق التفكير إلى تحسين الأداء.

يعد S1 مثالًا على نماذج التفكير المفتوحة المصدر التي تم تطويرها لجزء بسيط من تكلفة النماذج الرئيسية من Google و Openai. في كانون الثاني (يناير) ، أصدر باحثو جامعة كاليفورنيا في بيركلي نموذج تفكير مفتوح المصدر يسمى SKY-T1 يكلف 450 دولارًا “، مما يدل على أنه من الممكن تكرار قدرات التفكير العالية على المستوى المعقولة والكفاءة” ، وفقًا لمدونة المدونة. هناك أيضًا نموذج التفكير في RSTAR-MATH مفتوح المصدر من باحثو Microsoft Asia ، Tulu 3 من معهد أبحاث غير الربح AI2 ، ولديه Huggingface مبادرة خاصة به لتكرار R1 Deepseek.

نظرًا لأن النماذج عالية الجودة أصبحت أكثر سهولة وأرخص ، فقد بدأنا نرى تحولًا في القوة من الضاربون الثقيلون القلائل من الذكاء الاصطناعي إلى الكثيرين.

موضوعات
الذكاء الاصطناعي Openai




اكتشاف المزيد من مرابع التكنولوجيا

اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى

اكتشاف المزيد من مرابع التكنولوجيا

اشترك الآن للاستمرار في القراءة والحصول على حق الوصول إلى الأرشيف الكامل.

Continue reading