تقوم Meta بتطوير نظام ذكاء اصطناعي جديد يمكنه إنشاء تفسيرات مرئية للنص وموجهات الرسم

يعد Dall-E أحد أكثر تطورات تطبيقات الذكاء الاصطناعي إثارة للاهتمام مؤخرًا، وهي أداة تعمل بالذكاء الاصطناعي تتيح لك إدخال أي إدخال نصي – مثل” الحصان باستخدام الوسائط الاجتماعية” – وستخرج الصور بناءً على فهمها لـ تلك البيانات.
من المحتمل أنك رأيت العديد من هذه التجارب المرئية تطفو في جميع أنحاء الإنترنت (يعد” Weird Dall-E Mini Generations ” مكانًا جيدًا للعثور على بعض الأمثلة الأكثر غرابة)، وبعضها مفيد للغاية وقابل للتطبيق في سياقات جديدة. والبعض الآخر مجرد تفسيرات غريبة ومربكة للعقل، والتي تُظهر كيف ينظر نظام الذكاء الاصطناعي AI إلى العالم.
“Make-A-Scene يُمكِّن الأشخاص من إنشاء صور باستخدام المطالبات النصية والرسومات ذات الشكل الحر. تستخدم أنظمة الذكاء الاصطناعي السابقة لتوليد الصور عادةً أوصافًا نصية كمدخلات، ولكن قد يكون من الصعب التنبؤ بالنتائج. على سبيل المثال، إدخال النص” رسم حمار وحشي يركب دراجة” قد لا يعكس بالضبط ما تخيلته؛ قد تكون الدراجة متجهة جانبًا، أو قد يكون الحمار الوحشي كبيرًا جدًا أو صغيرًا”.
تسعى Make a Scene إلى حل هذه المشكلة، من خلال توفير المزيد من عناصر التحكم للمساعدة في توجيه مخرجاتك – لذا فهي مثل Dall-E، ولكن من وجهة نظر Meta على الأقل، أفضل قليلاً، مع القدرة على استخدام المزيد من المطالبات لتوجيه النظام.
“Make-A-Scene يلتقط تخطيط المشهد لتمكين الرسومات الدقيقة كمدخلات. يمكنه أيضًا إنشاء تخطيطه الخاص مع مطالبات نصية فقط، إذا كان هذا هو ما يختاره المنشئ. يركز النموذج على تعلم الجوانب الرئيسية للصور التي من المرجح أن تكون مهمة لمنشئ المحتوى، مثل الأشياء أو الحيوانات”.
تسلط مثل هذه التجارب الضوء على المدى الذي وصلت إليه أنظمة الكمبيوتر في تفسير المدخلات المختلفة، وإلى أي مدى يمكن لشبكات الذكاء الاصطناعي الآن فهم ما نتواصل معه، وما نعنيه، بالمعنى المرئي.
في النهاية، سيساعد ذلك عمليات التعلم الآلي على تعلم وفهم المزيد حول كيفية رؤية البشر للعالم. قد يبدو الأمر مخيفًا بعض الشيء، لكنه سيساعد في النهاية على تشغيل مجموعة من التطبيقات الوظيفية، مثل السيارات الآلية، وأدوات إمكانية الوصول، وتجارب الواقع المعزز والواقع الافتراضي المحسّنة والمزيد.
رغم ذلك، كما ترون من هذه الأمثلة، ما زلنا بعيدين بعض الشيء عن التفكير في الذكاء الاصطناعي كشخص، أو أن نصبح واعين بأفكاره الخاصة.
لكن ربما ليس بعيدًا كما تعتقد. في الواقع، تعمل هذه الأمثلة بمثابة نافذة مثيرة للاهتمام في التطوير المستمر للذكاء الاصطناعي، والذي هو فقط للمتعة في الوقت الحالي، ولكن يمكن أن يكون له آثار كبيرة على المستقبل.
في اختبارها الأولي، منحت Meta العديد من الفنانين الوصول إلى Make-A-Scene لمعرفة ما يمكنهم فعله بها.
إنها تجربة مثيرة للاهتمام – تطبيق Make-A-Scene غير متاح للجمهور حتى الآن، ولكن يمكنك الوصول إلى المزيد من المعلومات التقنية حول المشروع هنا.
المصدر: socialmediatoday
قد يهمك:
أنواع تطبيقات الذكاء الاصطناعي في التعليم