أصدرت شركة DeepSeek، المختبر الصيني المدعوم ماليًا، نموذجًا مفتوحًا للذكاء الاصطناعي يُعرف باسم DeepSeek V3، والذي يتفوق على العديد من المنافسين في معايير الأداء الشائعة. يتميز هذا النموذج بكبر حجمه وكفاءته في التعامل مع المهام القائمة على النصوص مثل البرمجة وكتابة المقالات.
المنافس الجديد لـ ChatGPT
يشبه نموذج DeepSeek V3 إلى حد كبير ChatGPT، حيث يعتمد كلا النموذجين على أنظمة إحصائية تم تدريبها على مليارات الأمثلة، مما يساعدها في تعلم الأنماط والتنبؤ بالعبارات الشائعة. على سبيل المثال، غالبًا ما تسبق العبارة “إلى من” في البريد الإلكتروني عبارة “قد يهمك الأمر”.
لم تكشف DeepSeek عن الكثير من التفاصيل حول مصدر بيانات تدريب DeepSeek V3، ولكن توجد العديد من مجموعات البيانات العامة التي تحتوي على نصوص تم إنشاؤها بواسطة GPT-4 عبر ChatGPT. إذا كان DeepSeek V3 قد تم تدريبه باستخدام هذه البيانات، فقد يكون النموذج قد حفظ بعض مخرجات GPT-4 ويعيد إنتاجها حرفيًا.
في حديثه لـ TechCrunch، قال مايك كوك، زميل باحث في King’s College London والمتخصص في الذكاء الاصطناعي: “من الواضح أن النموذج قد تعامل مع مخرجات ChatGPT في مرحلة ما، ولكن لا يزال غير واضح متى حدث ذلك”. وأضاف “قد يكون هذا مجرد مصادفة، ولكننا للأسف شهدنا حالات فيها أشخاص يدربون نماذجهم على مخرجات نماذج أخرى للاستفادة من معرفتها”.
وأشار كوك إلى أن تدريب النماذج على مخرجات أنظمة الذكاء الاصطناعي المنافسة قد يضر بجودة النموذج، حيث يمكن أن يؤدي ذلك إلى حدوث هلوسة وإجابات مضللة. وقال: “هذا يشبه أخذ نسخة من نسخة مصورة، حيث نفقد المزيد من المعلومات والتواصل مع الواقع”.
كما أشار إلى أن هذه الممارسة قد تكون مخالفة لشروط خدمة الأنظمة المستخدمة، حيث تمنع OpenAI مستخدمي منتجاتها، بما في ذلك ChatGPT، من استخدام مخرجاتها لتطوير نماذج منافسة. في نفس السياق، نشر الرئيس التنفيذي لشركة OpenAI، سام ألتمان، ما بدا أنه انتقاد لـ DeepSeek ومنافسيها على منصة X يوم الجمعة.