قدمت شركة مايكروسوفت للأبحاث نموذجًا جديدًا للذكاء الاصطناعي يُدعى “Magma”، الذي قد يشكل طفرة كبيرة في مجال الذكاء الاصطناعي، حيث يمكنه التحكم في كل من واجهات البرامج والأنظمة الروبوتية. يجمع Magma بين المعالجة البصرية واللغوية، مما يتيح له العمل في كل من البيئة الرقمية والمادية، ويجعله نموذجًا متعدد الاستخدامات.
ثورة جديدة في الذكاء الاصطناعي من مايكروسوفت
وعلى عكس العديد من أنظمة الذكاء الاصطناعي المتعددة الوسائط التي تستخدم نماذج منفصلة لمعالجة البيانات وأداء الإجراءات، يدمج Magma هذه القدرات في نظام واحد. وتؤكد Microsoft أن هذا يميز Magma عن غيره، حيث يمكنه معالجة النصوص والصور والفيديو والتفاعل معها بشكل أصلي، سواء كان ذلك للتنقل في البرامج أو التحكم في الروبوتات.
هذا التقدم قد يفضي إلى تطوير أنظمة ذكاء اصطناعي أكثر استقلالية وذكاء، قادرة على العمل في سيناريوهات متعددة. وقد تم تطوير Magma بالتعاون مع مؤسسات أكاديمية مرموقة مثل KAIST وجامعة ماريلاند وجامعة ويسكونسن ماديسون وجامعة واشنطن.
هدف الذكاء الاصطناعي هنا يتجاوز مجرد الإجابة على الأسئلة أو تنفيذ أوامر فردية، حيث تتصور Microsoft أن هذه الخطوة هي تمهيد لإنشاء نظام ذكاء اصطناعي وكيل قادر على التخطيط وتنفيذ مهام معقدة من خلال خطوات متعددة دون الحاجة لتدخل بشري.
في أبحاثها، تبرز Microsoft كيف يمكن لـ Magma صياغة خطط بناءً على هدف محدد واتخاذ الإجراءات اللازمة لتحقيقه، مستفيدة من البيانات المرئية واللغوية المتاحة. يمكن لهذا أن يُمكّن Magma من التعامل مع مهام معقدة في بيئات افتراضية ومادية، مع إمكانيات تطبيق واسعة في مجالات مثل التصنيع والرعاية الصحية والأتمتة الرقمية.
وتستكشف شركات تكنولوجيا أخرى مثل OpenAI وGoogle أيضًا إمكانيات الذكاء الاصطناعي الوكيل. تركز تجارب OpenAI على أداء المهام في متصفحات الويب من خلال مشروع “Operator”، بينما تعمل Google على تطوير الذكاء الاصطناعي الوكيل عبر مبادرة “Gemini 2.0”. لكن ما يميز Magma هو نهجها المتكامل في الإدراك والعمل، مما يتيح لها ميزة محتملة في التطبيقات الواقعية.