أثارت شركة التكنولوجيا الصينية الناشئة “ديب سيك” (DeepSeek) ضجة كبيرة في مجال التكنولوجيا بعد إطلاقها نموذجين لغويين ضخاميين ينافسان أدوات الذكاء الاصطناعي المهيمنة التي طورتها الشركات الأمريكية الكبرى، ولكن بتكلفة وحوسبة أقل بكثير.
قصة نجاح نموذج DeepSeek في الذكاء الاصطناعي
وفقًا لموقع “nature”، في 20 يناير، أصدرت الشركة، التي يقع مقرها في هانغتشو، نموذج “استدلال” مفتوح المصدر جزئيًا يسمى DeepSeek-R1. يستطيع هذا النموذج حل بعض المشاكل العلمية بمستوى مماثل لأحدث نماذج OpenAI، بما في ذلك نموذج “o1″، الذي أُطلق في نهاية العام الماضي. وفي وقت لاحق من الأسبوع، أطلقت الشركة نموذجًا آخر يدعى Janus-Pro-7B، والذي يمكنه إنشاء صور بناءً على النصوص، مثل أدوات DALL-E 3 وStable Diffusion التابعة لـ OpenAI وStability AI في لندن.
إذا فاجأ أداء DeepSeek-R1 العديد من المهتمين خارج الصين، فإن الباحثين داخل البلاد يرون أن نجاح الشركة الناشئة كان متوقعًا في ضوء الطموحات الحكومية الصينية التي تسعى لتصبح رائدة عالمياً في مجال الذكاء الاصطناعي.
ويقول يونجي تشين، عالم الكمبيوتر في معهد تكنولوجيا الحوسبة التابع للأكاديمية الصينية للعلوم في بكين، إن ظهور شركة مثل DeepSeek كان متوقعًا نتيجة للاستثمار الكبير في رأس المال الاستثماري في الصين، بالإضافة إلى وجود عدد كبير من العلماء الحاصلين على درجات الدكتوراه في مجالات العلوم والتكنولوجيا، بما في ذلك الذكاء الاصطناعي.
الحكومة الصينية تضع الذكاء الاصطناعي في أولوياتها
في عام 2017، أعلنت الصين عن خططها لتصبح رائدة في مجال الذكاء الاصطناعي بحلول عام 2030، وكلفت الصناعة بتطوير ابتكارات جديدة في هذا المجال لتحقيق المستوى العالمي بحلول عام 2025. كما تم التركيز على تعليم الذكاء الاصطناعي، حيث وافقت وزارة التعليم الصينية في 2022 على 440 جامعة لتقديم درجات جامعية متخصصة في هذا المجال.
وبدورها، تقول مارينا تشانج، الباحثة في سياسة العلوم في جامعة سيدني للتكنولوجيا، إن DeepSeek قد استفادت من استثمار الحكومة في تعليم الذكاء الاصطناعي وتنمية المواهب. وأضافت أن المبادرات المدعومة من الدولة، مثل المختبر الوطني للهندسة لتكنولوجيا التعلم العميق الذي تقوده شركة بايدو في بكين، قد دربت آلاف المتخصصين في الذكاء الاصطناعي.
الكفاءة رغم القيود
ما يثير الاهتمام في نجاح DeepSeek هو أنها طورت نماذجها، مثل DeepSeek-R1 وJanus-Pro-7B، في ظل ضوابط التصدير التي فرضتها الحكومة الأمريكية، والتي تمنع الصين من الوصول إلى شرائح الحوسبة المتقدمة منذ عام 2022.
يقول الباحثون إن الشركة اتبعت نهجًا مبتكرًا وفعالًا، حيث استخدمت حوالي 2000 شريحة H800 من شركة “نفيديا” لتدريب نموذج DeepSeek-V3، الذي تفوق على GPT-4 من OpenAI في اختبارات الأداء. بينما تعتمد نماذج أخرى مثل Llama 3.1 من Meta على 16000 شريحة H100 الأكثر تقدمًا.
ويعتمد نهج DeepSeek على تقنيات تعلم آلي مبتكرة تساعد في تقليل عدد الرقائق المطلوبة للتدريب. كما تستخدم الشركة تقنيات مثل “الانتباه الكامن متعدد الرؤوس” لتقليل متطلبات الذاكرة.
تأثير عالمي
وفقًا للباحثين، يمكن أن تشكل إنجازات DeepSeek نموذجًا يحتذى به للدول التي ترغب في تطوير الذكاء الاصطناعي، لكن تواجه صعوبات مالية أو قيودًا في الوصول إلى الأجهزة اللازمة لتدريب النماذج وفقًا للمعايير المعتادة في وادي السيليكون.