تكنولوجيا

Deepseek R1: لماذا يعتقد خبراء الذكاء الاصطناعى أنه مميز للغاية


فجأة ، ديبسيك في كل مكان.

نموذج R1 الخاص به مفتوح المصدر ، ويُزعم أنه تم تدريبه على جزء صغير من تكلفة نماذج الذكاء الاصطناعى الأخرى ، وهو جيد تمامًا ، إن لم يكن أفضل من ChatGPT.

ضربت هذه المجموعة المميتة وول ستريت بشدة ، مما تسبب في تعثر أسهم التكنولوجيا ، وجعل المستثمرين يتساءلون عن مقدار الأموال اللازمة لتطوير نماذج جيدة من الذكاء الاصطناعي. يزعم مهندسو Deepseek أن R1 تم تدريبه على 2788 وحدات معالجة الرسومات التي تكلف حوالي 6 ملايين دولار ، مقارنةً بـ GPT-4 من Openai والتي تبلغ قيمتها 100 مليون دولار للتدريب.

تتحدى كفاءة تكلفة Deepseek أيضًا فكرة أن النماذج الأكبر والمزيد من البيانات تؤدي إلى أداء أفضل. في خضم المحادثة المحمومة حول قدرات Deepseek ، وتهديدها لشركات الذكاء الاصطناعى مثل Openai ، والمستثمرين المخيفون ، قد يكون من الصعب فهم ما يجري. لكن خبراء الذكاء الاصطناعى ذوي الخبرة المخضرمة قد تأثروا بوجهات نظر قيمة.

يثبت Deepseek ما يقوله خبراء الذكاء الاصطناعى لسنوات: أكبر ليس أفضل

أعاقها القيود التجارية والوصول إلى NVIDIA GPU ، كان على Deepseek مقراً له أن يكون مبدعًا في تطوير R1 وتدريبه. كان أنهم تمكنوا من إنجاز هذا العمل الفذ مقابل 6 ملايين دولار فقط (وهو ليس الكثير من المال من حيث الذكاء الاصطناعي) بمثابة الوحي للمستثمرين.

لكن خبراء الذكاء الاصطناعي لم يفاجأوا. “في Google ، سألت لماذا تم تثبيتها على بناء أكبر نموذج. لماذا تسير في الحجم؟ ما هي الوظيفة التي تحاول تحقيقها؟ لماذا الشيء الذي كنت منزعجًا من أنه لم يكن لديك أكبر نموذج؟ ردت بإطلاق النار لي ، “نشرت Timnit Gebru ، التي تم إنهاءها من Google لاستدعاء تحيز الذكاء الاصطناعي ، على X.

سرعة الضوء القابلة للضوء

أشارت مناخ المعانقة في Face و AI Lead Sasha Luccioni إلى كيفية بناء استثمار الذكاء الاصطناعي بشكل غير مستقر على التسويق والضجيج. وقال لوكسيوني: “من المتوحش أن التلميح إلى أن LLM واحد (عالي الأداء) قادر على تحقيق هذا الأداء دون أن يكون القرف الغاشم من بين آلاف وحدات معالجة الرسومات يكفي للتسبب في ذلك”.

توضيح سبب كون Deepseek R1 مشكلة كبيرة

أداء Deepseek R1 بشكل مماثل لنموذج Openai O1 على المعايير الرئيسية. لقد تجاوزت بشكل هامشي أو تعادل أو سقط أقل بقليل من O1 على اختبارات الرياضيات والترميز والمعرفة العامة. وهذا يعني أن هناك نماذج أخرى ، مثل كلود ، وجيميني Google ، ونموذج Meta مفتوح المصدر Llama القادر على المستخدم العادي.

لكن R1 تسبب مثل هذا الهيجان بسبب القليل من تكلفة صنعه. وقال غاري ماركوس عالم أبحاث الذكاء الاصطناعي: “إنها ليست أكثر ذكاءً من النماذج السابقة ، حيث تدربت فقط بشكل أرخص”.

حقيقة أن ديبسيك كان قادرًا على بناء نموذج يتنافس مع نماذج Openai أمر رائع للغاية. Andrej Karpathy الذي شارك في تأسيس Openai ، نشر على X ، “هل هذا يعني أنك لا تحتاج إلى مجموعات GPU كبيرة لـ Frontier LLMS؟ لا ، ولكن عليك التأكد دليل جميل على أنه لا يزال هناك الكثير للوصول إلى كل من البيانات والخوارزميات “.

قال أستاذ Wharton AI إيثان موليك إن الأمر لا يتعلق بقدراته ، ولكن النماذج التي يمكن للأشخاص حاليًا الوصول إليها. وقال “Deepseek نموذج جيد حقًا ، لكنه ليس نموذجًا أفضل بشكل عام من O1 أو Claude”. “ولكن نظرًا لأنه مجاني وحصل على الكثير من الاهتمام ، أعتقد أن الكثير من الأشخاص الذين يستخدمون نماذج” صغيرة “مجانية يتعرضون لما يمكن أن يفعله AI في أوائل عام 2025 وتفاجأ”.

يسجل واحد لنماذج AI مفتوحة المصدر

يعد Deepseek R1 Breakout فوزًا كبيرًا لأنصار المصادر المفتوحة الذين يجادلون بأن إضفاء الطابع الديمقراطي على الوصول إلى نماذج الذكاء الاصطناعى القوية ، يضمن الشفافية والابتكار والمنافسة الصحية. وقال يان ليكون ، كبير علماء الذكاء الاصطناعي في Meta ، الذي دعم المصادر المفتوحة مع نماذج Llama الخاصة بها: “بالنسبة للأشخاص الذين يعتقدون” الصين تتفوق على الولايات المتحدة في الذكاء الاصطناعي “، فإن الفكر الصحي .

لم يذكر عالم الكمبيوتر وخبير الذكاء الاصطناعي أندرو نغ صراحة أهمية R1 كونها نموذجًا مفتوحًا المصدر ، ولكنه أبرز كيف يعد تعطيل Deepseek بمثابة نعمة للمطورين ، لأنه يتيح الوصول إلى البوابة بواسطة Big Tech.

وقال NG: “” Deepseek Selloff اليوم “في سوق الأوراق المالية – المنسوبة إلى Deepseek V3/R1 تعطل النظام الإيكولوجي للتكنولوجيا – هي علامة أخرى على أن طبقة التطبيق هي مكان رائع”. “طبقة نموذج الأساس كونها شديدة التنافسية هي رائعة لأشخاص بناء التطبيقات.”

موضوعات
الذكاء الاصطناعي ديبسيك




اكتشاف المزيد من مرابع التكنولوجيا

اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى

اكتشاف المزيد من مرابع التكنولوجيا

اشترك الآن للاستمرار في القراءة والحصول على حق الوصول إلى الأرشيف الكامل.

Continue reading