تشتعل معركة التفوق في مجال الذكاء الاصطناعي. بعد أسبوع تقريبًا من إتاحة OpenAI لنموذج o1 الخاص بها للجمهور، تقدم Google اليوم معاينة لنموذج Gemini 2.0 من الجيل التالي. في منشور مدونة منسوب إلى الرئيس التنفيذي لشركة Google Sundar Pichai، تقول الشركة إن 2.0 هو نموذجها الأكثر كفاءة حتى الآن، حيث تقدم الخوارزمية دعمًا أصليًا لإخراج الصور والصوت. يقول Pichai: “سيمكننا ذلك من بناء وكلاء ذكاء اصطناعي جدد يقربوننا من رؤيتنا لمساعد عالمي”.
تقوم Google بشيء مختلف مع Gemini 2.0. فبدلاً من بدء معاينة اليوم من خلال تقديم إصدارها الأكثر تقدمًا من النموذج، Gemini 2.0 Pro، تبدأ شركة البحث العملاقة الأمور بدلاً من ذلك مع 2.0 Flash. اعتبارًا من اليوم، يتوفر النموذج الأكثر كفاءة (وبأسعار معقولة) لجميع مستخدمي Gemini. إذا كنت تريد تجربته بنفسك، يمكنك تمكين Gemini 2.0 من القائمة المنسدلة في عميل الويب Gemini، مع توفره داخل تطبيق الهاتف المحمول قريبًا.
في المستقبل، تقول Google إن تركيزها الرئيسي هو إضافة ذكاء 2.0 إلى البحث (ليس من المستغرب هنا)، بدءًا من AI Overviews. وفقًا للشركة، سيسمح النموذج الجديد للميزة بمعالجة أسئلة أكثر تعقيدًا وتداخلًا، بما في ذلك تلك التي تنطوي على مشاكل رياضية وترميز متعددة الخطوات. في الوقت نفسه، بعد التوسع الواسع في أكتوبر، تخطط Google لإتاحة AI Overviews بلغات ودول أكثر.
إعلان
بالنظر إلى المستقبل، يعمل Gemini 2.0 بالفعل على تشغيل التحسينات لبعض تطبيقات الذكاء الاصطناعي الأكثر تقدمًا من Google، بما في ذلك Project Astra، وكيل الذكاء الاصطناعي متعدد الوسائط الذي عرضته الشركة في I/O 2024. وبفضل النموذج الجديد، تقول Google إن أحدث إصدار من Astra يمكنه التحدث بلغات متعددة وحتى التبديل بينها أثناء التنقل. كما يمكنه “تذكر” الأشياء لفترة أطول، ويوفر زمن انتقال محسّن، ويمكنه الوصول إلى أدوات مثل Google Lens وMaps.
كما قد تتوقع، يقدم Gemini 2.0 Flash أداءً أفضل بكثير من سابقه. على سبيل المثال، حصل على درجة 63 بالمائة في HiddenMath، وهو معيار يختبر قدرة نماذج الذكاء الاصطناعي على إكمال مسائل الرياضيات على مستوى المنافسة. وعلى النقيض من ذلك، حصل Gemini 1.5 Flash على درجة 47.2 بالمائة في نفس الاختبار. ولكن الشيء الأكثر إثارة للاهتمام هنا هو أن الإصدار التجريبي من Gemini 2.0 يتفوق حتى على Gemini 1.5 Pro في العديد من المجالات؛ في الواقع، وفقًا للبيانات التي شاركتها Google، فإن المجالات الوحيدة التي يتخلف فيها هي في فهم السياق الطويل والترجمة التلقائية للكلام.
ولهذا السبب تحتفظ Google بالنموذج الأقدم، على الأقل لفترة أطول قليلاً. إلى جانب الإعلان اليوم عن Gemini 2.0، أطلقت الشركة أيضًا Deep Research، وهي أداة جديدة تستخدم قدرات السياق الطويل في Gemini 1.5 Pro لكتابة تقارير شاملة حول مواضيع معقدة.
نقلاً عن : الوفد