أعلنت شركة DeepSeek الصينية عن إطلاق نموذجين جديدين للذكاء الاصطناعي هما R1 وR1-Zero، زاعمة أنهما يتطابقان مع أداء نماذج الاستدلال المنطقي o1 من الشركة الرائدة OpenAI، وهي نماذج تستغرق بعض الوقت في التفكير والتحليل والتحليل. المقارنة والتقييم قبل توليد الإجابات.
بالإضافة إلى ذلك، قدمت الشركة الصينية 6 نماذج أصغر مفتوحة المصدر، بعضها ينافس أداء نموذج OpenAI-o1-mini.
ويتميز نموذج DeepSeek-R1-Zero بأسلوب تعليمي مبتكر، إذ طور مهاراته الاستدلالية باستخدام التعلم المعزز دون الاعتماد على الأمثلة البشرية. واعتمد النموذج على نظام مكافآت مبسط وقواعد واضحة للتحقق من دقة الإجابات، بما في ذلك التحقق من صحة حلول المسائل الرياضية وبرمجة التعليمات.
وقد طورت DeepSeek خوارزمية جديدة تقوم بتقييم مجموعات من الإجابات بدلاً من تقييم كل إجابة على حدة، وقد مكنت هذه التقنية النموذج من تحسين أدائه بكفاءة.
وعلى الرغم من إمكانياته الواعدة، واجه النموذج مشكلتين رئيسيتين: صعوبة قراءة الإجابات وخلط اللغات. ولمكافحة ذلك، أطلقت DeepSeek نموذج R1، الذي يبدأ بالتدريب الأولي على البيانات الصغيرة، ثم يخضع لجولات متعددة من التعلم المعزز لتحسين الأداء.
وأظهرت الاختبارات أن نموذج DeepSeek-R1 حقق أداءً قريبًا من أداء نموذج OpenAI-o1-1217 عبر العديد من معايير الاستدلال المستخدمة لاختبار نماذج الذكاء الاصطناعي.
طورت الشركة 6 نماذج صغيرة تتراوح من 1.5 إلى 70 مليار معلمة. استخدمت هذه النماذج 800000 مثال تدريبي تم إنشاؤها بواسطة نموذج R1 الأكبر. أظهرت النماذج الصغيرة (النماذج المقطرة)، مثل R1-Distill-Llama-70B وR1-Distill-Qwen، أن 32B يتمتع بقدرات استدلال قوية، متفوقة على العديد من النماذج الأكبر حجمًا.
تتوفر نماذج DeepSeek-R1 بموجب ترخيص معهد ماساتشوستس للتكنولوجيا (MIT)، مما يسمح باستخدامها وتخصيصها وتطويرها بحرية. يمكن الوصول إلى هذه النماذج عبر GitHub وHuggingFace، أو من خلال واجهة برمجة التطبيقات الخاصة بالشركة بأسعار محددة أرخص بكثير من نماذج OpenAI.
يأتي ذلك بعد أن أطلقت الشركة الصينية نموذجها DeepSeek-V3، والذي يعتبر من أقوى النماذج مفتوحة المصدر في العالم، مقارنة بنماذج أخرى مثل GTP-4o.

















