تمنح هذه الشركة الناشئة خطابك صوت ذكاء اصطناعي جديد “واقعي بشري”

تطلق Voicemod 20 تجسيدًا صوتيًا بصوت الإنسان لتعزيز التعبير الذاتي للمستخدمين عبر الإنترنت
من المساعدين الافتراضيين إلى التعليقات الصوتية للكتب الصوتية، برز توليد الصوت بالذكاء الاصطناعي كمجال سريع النمو – ولا عجب أن تسارع الشركات للاستفادة من إمكانات التكنولوجيا.
من بينها Voicemod ومقرها فالنسيا.
طورت الشركة الناشئة مغيرًا صوتيًا يعمل بالذكاء الاصطناعي وبرنامجًا لموجه الصوت يتيح التحويل الفوري للكلام إلى كلام. على عكس معظم منافسيها، تدعي الشركة أنها تقوم بتحويل الأصوات في الوقت الفعلي وبزمن انتقال منخفض، مما يتيح للمستخدمين التحدث كما يفعلون في الحياة الواقعية.
وفقًا لـ Jaime Bosch ، الرئيس التنفيذي والمؤسس المشارك لشركة Voicemod ، تدرب الشركة نموذج الذكاء الاصطناعي الخاص بها باستخدام مجموعات البيانات المتاحة للجمهور والجهات الفاعلة الصوتية المحترفة، مما ينتج عنه مجموعة واسعة من التعبيرات الصوتية والنغمات والنغمات والعواطف.
من خلال تقنيات التعلم الآلي، يتعلم النموذج فهم أنماط كلام الشخص وتعقيداته وتحليلها والتنبؤ بها.
قال بوش لـ TNW: “عندما يتحدث المستخدم إلى برنامجنا أو تطبيقنا، تتم معالجة مدخلاته الصوتية في الوقت الفعلي”.
ثم يطبق نموذج الذكاء الاصطناعي الخاص بنا الأنماط والتحولات المكتسبة على المدخلات، مما يسمح بتحويل صوتي فوري.
يستهدف Voicemod بشكل أساسي صناعة الترفيه، بما في ذلك اللاعبين، ومنشئو البث، ومنشئي المحتوى، و vtubers في منصات تتراوح من Discord و Twitch ، إلى Zoom و WhatsApp.
لمزيد من الاستجابة لطلب المستخدم المتزايد للتعبير عن الذات، والأسماء المستعارة، والإبداع عبر الإنترنت، بجانب خيارات الصوت المائة في محفظتها، تطلق الشركة الناشئة الآن ما يسمى بمجموعة “AI Humans”.
على الرغم من أن Voicemod يقدم بالفعل مرشحات صوتية بشرية، إلا أنه من المقرر أن تكون المجموعة الجديدة أكثر مجموعات الشركة واقعية حتى الآن.

تم تدريب AI Humans على تسجيلات من الممثلين الصوتيين، ويتكون من 20 صورة رمزية صوتية تتراوح في الشخصية والجنس والعمر. تشمل الشخصيات جو، صوت ذكر يبلغ من العمر 80 عامًا “نبرة خشن ساخر” وجينيفر، صوت أنثى يبلغ من العمر 25 عامًا، يتميز بشخصية “حيوية وودودة”. يمكن للمستخدمين أيضًا تخصيص درجة الصوت لكل شخصية، وتغيير تصور جنس الصوت وعمره.
يمكن أن يمنحك الفيديو أدناه فكرة عن كيفية ظهور هذه الشخصيات:
قال بوش: “توفر أصوات الذكاء الاصطناعي فرصًا مثيرة للصناعات التي تتطلع إلى تنمية الاستكشاف الإبداعي والتعبير عن الذات، وتعزيز التخصيص، وتعزيز الشمولية في المساحات الرقمية”.
ولكن على الرغم من التأثير الإيجابي الذي يمكن أن يحدثه توليد الصوت بالذكاء الاصطناعي، فإن التكنولوجيا مرتبطة أيضًا بالعديد من المخاطر.
يشمل بعضها إساءة الاستخدام والاحتيال وانتحال الهوية وحتى سرقة الصوت، والتي تؤثر بشكل خاص على الممثلين الصوتيين المحترفين.
وفقًا لـ Bosch ، تعمل Voicemod بنشاط للتخفيف من هذه المخاطر. على سبيل المثال، تقوم بتطوير تقنية العلامات المائية لمساعدة المنصات على تحديد وتتبع الأصوات التي تم إنشاؤها بواسطة الذكاء الاصطناعي، بينما نفذت تدابير لحماية الملكية الفكرية لممثلي الصوت الذين تعمل معهم.
يعتقد بوش أن الذكاء الاصطناعي سيصبح “أداة” لهؤلاء المحترفين. وقال لـ TNW: “هناك شيء ربما يكون مفقودًا في هذه المناقشات هو أنه وراء كل استخدام للذكاء الاصطناعي الصوتي في الوقت الفعلي، فإن حالة الاستخدام التي يستهدفها Voicemod ، هو إنسان يقود الذكاء الاصطناعي بشكل فعال”.
يحسب Voicemod بالفعل أكثر من 40 مليون تنزيل لسطح المكتب. في المستقبل، تخطط لإطلاقها على الهاتف المحمول، بينما تعمل أيضًا على شراكات B2B مع شركات الألعاب ومنصات سماعات الرأس VR.
البرنامج متاح مجانًا، مع خيار إصدار PRO مدفوع يفتح الميزات والمحتوى الإضافي.
المصدر: thenextweb
قد يهمك: