Astra هي إجابة Google “متعددة الوسائط” على ChatGPT الجديد
يقول بولكيت أغراوال، الأستاذ المساعد في معهد ماساتشوستس للتكنولوجيا والذي يعمل في مجال الذكاء الاصطناعي والروبوتات، إن أحدث العروض التوضيحية لـ Google وOpenAI مثيرة للإعجاب وتظهر مدى سرعة تقدم نماذج الذكاء الاصطناعي متعدد الوسائط. أطلقت OpenAI نظام GPT-4V، وهو نظام قادر على تحليل الصور في سبتمبر 2023. وقد أعجب بقدرة Gemini على فهم الفيديو المباشر – على سبيل المثال، تفسير التغييرات التي تم إجراؤها على رسم تخطيطي على السبورة البيضاء بشكل صحيح في الوقت الفعلي. يبدو أن الإصدار الجديد من ChatGPT الخاص بـ OpenAI قادر على القيام بنفس الشيء.
يقول أغراوال إن المساعدين الذين عرضتهم شركتا Google وOpenAI يمكن أن يوفروا بيانات تدريب جديدة للشركات بينما يتفاعل المستخدمون مع النماذج في العالم الحقيقي. ويضيف: “لكن يجب أن تكون مفيدة”. “السؤال الكبير هو ما الذي سيستخدمه الناس من أجله – إنه ليس واضحًا تمامًا”.
تقول Google إن Project Astra سيكون متاحًا من خلال واجهة جديدة تسمى Gemini Live في وقت لاحق من هذا العام. وقال هاسابيس إن الشركة لا تزال تختبر العديد من النماذج الأولية للنظارات الذكية ولم تتخذ قرارًا بعد بشأن ما إذا كانت ستطلق أيًا منها.
قد توفر قدرات Astra لشركة Google فرصة لإعادة تشغيل نسخة من نظارتها الزجاجية الذكية المشؤومة، على الرغم من تعثر الجهود المبذولة لبناء أجهزة مناسبة للذكاء الاصطناعي التوليدي حتى الآن. على الرغم من العروض التوضيحية المثيرة للإعجاب التي تقدمها OpenAI وGoogle، لا تستطيع الوسائط المتعددة الوسائط فهم العالم المادي والأشياء الموجودة فيه بشكل كامل، مما يضع قيودًا على ما يمكنهم القيام به.
يقول بريندن ليك، الأستاذ المشارك في جامعة نيويورك والذي يستخدم الذكاء الاصطناعي لاستكشاف الذكاء البشري: “إن القدرة على بناء نموذج عقلي للعالم المادي من حولك أمر ضروري للغاية لبناء المزيد من الذكاء البشري”.
يشير ليك إلى أن أفضل نماذج الذكاء الاصطناعي اليوم لا تزال تتمحور حول اللغة لأن الجزء الأكبر من تعلمها يأتي من النصوص المأخوذة من الكتب والويب. وهذا يختلف جوهريًا عن كيفية تعلم اللغة من قبل البشر، الذين يلتقطونها أثناء التفاعل مع العالم المادي. ويقول عن عملية إنشاء نماذج متعددة الوسائط: “إنها خطوة عكسية مقارنة بنمو الطفل”.
يعتقد هاسابيس أن إضفاء فهم أعمق للعالم المادي على نماذج الذكاء الاصطناعي سيكون أمرًا أساسيًا لمزيد من التقدم في الذكاء الاصطناعي، ولجعل أنظمة مثل Project Astra أكثر قوة. ويقول إن الحدود الأخرى للذكاء الاصطناعي، بما في ذلك عمل Google DeepMind في برامج الذكاء الاصطناعي التي تمارس الألعاب، يمكن أن تساعد. ويأمل هاسابيس وآخرون أن يكون هذا العمل ثوريًا في مجال الروبوتات، وهو مجال تستثمر فيه جوجل أيضًا.
وقال هاسابيس: “إن المساعد العالمي متعدد الوسائط يسير على الطريق الصحيح نحو الذكاء العام الاصطناعي”، في إشارة إلى نقطة مستقبلية مأمول بها ولكنها غير محددة إلى حد كبير، حيث يمكن للآلات أن تفعل أي شيء وكل شيء يستطيع العقل البشري القيام به. “هذا ليس الذكاء الاصطناعي العام أو أي شيء، ولكنه بداية شيء ما.”
تم التحديث بتاريخ 14-5-2024، الساعة 4:15 مساءً بتوقيت شرق الولايات المتحدة: تم تحديث هذه المقالة لتوضيح الاسم الكامل لمشروع Google.
اكتشاف المزيد من مجلة الإبداع
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.