يُطلق Synthesis AI لأول مرة إمكانات تحويل النص إلى ثلاثي الأبعاد عالية الدقة مع المعامل التوليفية

أعلنت شركة Synthesis AI، وهي شركة ناشئة مقرها سان فرانسيسكو متخصصة في تقنيات البيانات التركيبية، اليوم أنها طورت طريقة جديدة لإنشاء إنسان رقمي ثلاثي الأبعاد واقعي من الرسائل النصية.
وقالت الشركة إن تقنيتها الجديدة لتحويل النص إلى ثلاثي الأبعاد، والتي يتم عرضها في معامل توليف النظام الأساسي عبر الإنترنت، تستخدم الذكاء الاصطناعي التوليدي (AI) وخطوط أنابيب المؤثرات المرئية لإنتاج بشر رقمي عالي الدقة وجودة سينمائية يمكن استخدامها في تطبيقات مختلفة مثل الألعاب والواقع الافتراضي والأفلام والمحاكاة.
تدعي شركة Synthesis AI أنها أول شركة تعرض تخليقًا بشريًا رقميًا من نص إلى ثلاثي الأبعاد بمستوى عالٍ من الجودة والتفاصيل.
تتيح هذه التقنية للمستخدمين إدخال أوصاف نصية للإنسان الرقمي المطلوب، مثل العمر والجنس والعرق وتصفيفة الشعر والملابس، ثم إنشاء نموذج ثلاثي الأبعاد يطابق المواصفات.
يمكن للمستخدمين أيضًا تحرير النموذج ثلاثي الأبعاد عن طريق تغيير المطالبات النصية أو استخدام أشرطة التمرير لضبط ميزات مثل تعابير الوجه والإضاءة.
قالت الشركة إن تقنية تحويل النص إلى 3D كانت جزءًا من مهمتها الأوسع نطاقًا لدعم تطبيقات الذكاء الاصطناعي المتقدمة من خلال توفير بيانات تركيبية مصنفة تمامًا لتدريب نماذج التعلم الآلي (ML).
البيانات التركيبية هي بيانات تم إنشاؤها بشكل مصطنع تحاكي البيانات الحقيقية ولكنها لا تحتوي على أي معلومات شخصية أو حساسة.
صرح ياشار بهزادي، الرئيس التنفيذي ومؤسس شركة Synthesis AI لـ VentureBeat: “إن إمكانية تحويل النص إلى ثلاثي الأبعاد التي نعرضها في مختبرات التوليف تتخذ منهجًا برمجيًا مدفوعًا بواجهة برمجة التطبيقات كنقطة انطلاق لها، وتضيف واجهة مستخدم سريعة بسيطة للغاية وتخرج نموذجًا ثلاثي الأبعاد عالي الدقة يمكن استخدامه كبيانات تركيبية عبر مجموعة واسعة من حالات الاستخدام التي تتطلب بشرًا رقميًا”.
“تقوم مختبرات Synthesis بإخراج بعض أعمال البحث والتطوير الخاصة بنا مع العملاء الفعليين.”
يأتي هذا الإعلان بعد إطلاق سيناريوهات توليف البشر والتوليف، والتي تمثل عروض متعمقة للبيانات التركيبية المرتكزة على الإنسان والمتاحة حاليًا في السوق.
الاستفادة من تحويل النص إلى ثلاثي الأبعاد باستخدام الذكاء الاصطناعي التوليفي
جمعت Synthesis AI بين الذكاء الاصطناعي وخطوط أنابيب VFX السينمائية لإنتاج بيانات تركيبية مميزة تمامًا لتدريب نماذج ML.
يمثل هذا التطور المرة الأولى التي يتم فيها عرض التوليف البشري الرقمي من النص إلى ثلاثي الأبعاد بجودة سينمائية عالية الدقة، ومن المتوقع أن يؤدي إلى تسريع تطوير وتقليل تكاليف التطبيقات ثلاثية الأبعاد في مجموعة متنوعة من الصناعات بما في ذلك AR / VR، والألعاب، والمؤثرات البصرية، والمدن الذكية، والتجربة الافتراضية (VTON)، والسيارات، والمحاكاة الصناعية والتصنيعية.
يعد إنشاء النماذج ثلاثية الأبعاد عملية معقدة ومتعددة الأوجه تتطلب التفاعل بين العديد من العناصر، بما في ذلك الهندسة والشبكات وطبقات النسيج.
بالنسبة لفناني الألعاب والمؤثرات الصوتية المتمرسين، كان البدء بنموذج بشري للشخصيات والمشاهد التي تتمحور حول الإنسان هو الخيار المفضل تاريخيًا.
غالبًا ما يكون هذا النهج أسرع وأكثر وضوحًا من بناء إنسان تم إنشاؤه بواسطة الكمبيوتر من نقطة الصفر.
ومع ذلك، فإن صياغة نماذج بشرية عالية الجودة يعد إنجازًا صعبًا يتطلب إعدادات قياس تصويرية متخصصة.
تم تصميم هذه الإعدادات لالتقاط زوايا متعددة لأشخاص فعليين في ظل إعدادات مضبوطة لإنشاء صور أولية ثنائية الأبعاد.
يتم بعد ذلك دمج الصور بدقة باستخدام مجموعة متنوعة من الأدوات المصنوعة يدويًا والمحسنة لضمان الجودة المثلى.
من خلال التوليف البشري الرقمي من النص إلى ثلاثي الأبعاد، ابتكرت الشركة نهجًا مبتكرًا، حيث طورت نماذج داخلية تستفيد من بنيات الذكاء الاصطناعي التوليدية القائمة على الانتشار لإنشاء مجموعة متنوعة من الشبكات التي تحكمها معلمات مهمة مثل الجنس والعمر والعرق وغير ذلك.
يتم إنشاء طبقات النسيج باستخدام نموذج توليدي منفصل يوفر تحكمًا مستقلًا دقيق الحبيبات.
يتم إنتاج نموذج ثلاثي الأبعاد شامل وعالي الدقة من خلال دمج هذين المكونين الأساسيين.

قال بهزادي من Synthesis AI لـ VentureBeat: “إن تكوين مجموعة متنوعة من البشر أمر معقد أكثر بسبب الخدمات اللوجستية لتجنيد أفراد معينين والحصول على إعفاءات”.
“البدء بإنسان رقمي مركب غير مكلف هو أمر أسرع وأرخص من أي من هذين الخيارين.
تتيح إمكانية تحويل النص إلى ثلاثي الأبعاد إنشاء أصول عالية الجودة عند الطلب، مما يوفر أسابيع من الوقت وآلاف الدولارات لكل نموذج “.
تقدم عروض تحويل النص إلى ثلاثي الأبعاد الجديدة الموجودة في المعامل التجميعية الإدخال والتحرير الفوريين، مما يجعل إمكانات الذكاء الاصطناعي ثلاثية الأبعاد الخالية من التعليمات البرمجية أكثر سهولة في الوصول إلى جميع مستويات الخبرة.
قال بهزادي: “بالنسبة للمبتدئين، يجلب التوليد السريع والتكرار القدرة الإبداعية لأي شخص قادر على استخدام محرك بحث”. “
ومع ذلك، نعتقد أن المتبنين الأوائل والمستخدمين المتميزين سيكونون فنانين تقنيين في جميع أشكال الترفيه والوسائط، بالإضافة إلى مديري المنتجات في البرامج الصناعية والتصنيعية الذين يتطلعون إلى تعبئة المحاكاة ثلاثية الأبعاد مع البشر الرقميين التمثيليين.
كلاهما جمهور تقني، ولكن من المحتمل ألا يتمتع بمهارات متقدمة في تعلم الآلة.
تعد مكتبة Synthesis AI الخاصة بأكثر من 100000 شخص رقمي (أو معرفات) هي البيانات الأساسية المستخدمة لتدريب النماذج.
تعمل منتجات الشركة الأخرى، والبشر التوليفي والسيناريوهات التوليفة، بالفعل على الاستفادة من هذه المكتبة لدعم فرق الرؤية الحاسوبية الرائدة ببيانات التدريب المصنفة لدعم تطوير قدرات التعرف على الوجه، ومراقبة السائق، والصور الرمزية والمزيد.
ماذا بعد توليف الذكاء الاصطناعي؟
يمثل إطلاق المعامل التجميعية علامة بارزة في رحلة Synthesis AI لتمكين عملاء المؤسسات والصناعة والقطاع العام من محاكاة الواقع من خلال توليف أي شخص أو مكان أو كائن.
تشمل التطبيقات المحاكاة والبيانات التركيبية لتدريب نماذج رؤية الكمبيوتر في VFX وAR / VR وإنشاء الوسائط والمحتوى.
ستتوفر القدرات البشرية الرقمية الجديدة لتحويل النص إلى ثلاثي الأبعاد لمجموعة مختارة من مختبري النسخة التجريبية بدءًا من الربع الثاني من هذا العام.
قال بهزادي: “إن فتح القدرة على المستخدمين الخارجيين سيسمح لنا بالاستفادة من تعليقات المجتمع لزيادة تحسين النماذج التوليدية الأساسية”.
“التعلم المعزز من ردود الفعل البشرية (RLHF) هو مفتاح التحسين المستمر لأداء النماذج الأساسية واكتشاف الحالات المتطورة.”
قال بهزادي إنه من خلال الجمع بين الذكاء الاصطناعي التوليدي وخطوط أنابيب المؤثرات البصرية السينمائية، ستكون الشركات قادرة على تجميع العالم، بما في ذلك بيئات البشر والأشياء.
المصدر: venturebeat
قد يهمك: