أطلق مختبر الذكاء الاصطناعي الصيني DeepSeek عائلة جديدة من نماذج الذكاء الاصطناعي تحت اسم R1، التي تمتاز بحجم كبير يصل إلى 671 مليار معلمة في أكبر نسخة منها، وتدعي الشركة أن النموذج يعمل بمستويات مشابهة لنموذج “SR” من OpenAI (المستخدم في روبوت الدردشة ChatGPT) في العديد من مجالات الرياضيات والترميز.

نموذج DeepSeek R1

إلى جانب الإصدارات الرئيسية “DeepSeek-R1-Zero” و”DeepSeek-R1″، نشرت DeepSeek ستة إصدارات أصغر من “DeepSeek-R1-Distill”، تتراوح معلماتها من 1.5 مليار إلى 70 مليار. وتعتمد هذه النماذج على بنيات مفتوحة المصدر مثل Qwen وLlama، وتدربت باستخدام بيانات تم جمعها من نموذج R1 الكامل.

تعتبر النماذج الأصغر قابلة للتشغيل على أجهزة الكمبيوتر المحمولة، في حين أن النموذج الكامل يتطلب موارد حوسبة أكبر. وقد وصف الباحث المستقل في الذكاء الاصطناعي سيمون ويليسون، تجربة اختبار أحد النماذج الأصغر بأنها “ممتعة للغاية”، مشيرًا إلى أن النموذج يظهر تفكيرًا داخليًا معقدًا قبل تقديم أي استجابة، حتى في الحالات البسيطة.

يتميز نموذج R1 بآلية مختلفة عن النماذج التقليدية من خلال دمج ما يعرف بـ “الاستدلال المحاكى”، الذي يحاكي سلسلة من الأفكار مشابهة لتفكير الإنسان. تم تطوير هذا النهج ضمن ما يسمى “نماذج الاستدلال المحاكى” أو “نماذج SR”، وقد ظهر لأول مرة مع إصدار OpenAI نموذج “o1” في سبتمبر 2024. ونموذج R1 الذي أطلقته DeepSeek يظهر تفوقًا في بعض الاختبارات الرياضية والعلمية مقارنة بـ o1 من OpenAI، وفقًا للنتائج التي أفادت بها الشركة، على الرغم من أن هذه النتائج لم يتم التحقق منها بشكل مستقل بعد.

تجدر الإشارة إلى أن النماذج الجديدة من DeepSeek، مثل “R1″، تأتي مع بعض القيود في حال تم تشغيلها على السحابة، حيث تخضع لرقابة وفقًا للوائح الصينية، ولا يتم السماح للنموذج بتقديم إجابات حول قضايا حساسة مثل استقلال تايوان. ومع ذلك، لا تؤثر هذه الرقابة على تشغيل النموذج محليًا خارج الصين، حيث يمكن تشغيل النماذج على الأجهزة بعيدًا عن أي رقابة خارجية.

تمثل هذه النماذج تطورًا سريعًا في مجال الذكاء الاصطناعي، إذ تسعى الشركات الصينية لمنافسة قدرات OpenAI في هذا المجال.