تستخدم Microsoft Teams الذكاء الاصطناعي لعقد اجتماعات خالية من المتاعب

في أبريل 2020، خلال الأيام الأولى لوباء Covid-19، أعلنت Microsoft Teams أن القدرة على استخدام الذكاء الاصطناعي (AI) والتعلم الآلي (ML) لتصفية الكتابة والنباح والضوضاء الأخرى من مكالمات الفيديو كانت “قادمة” قريباً.”
في ذلك الوقت، كانت المنصة قد نمت بالفعل من 44 مليون مستخدم في مارس 2020 إلى 75 مليونًا بعد شهر، حيث تركت عمليات الإغلاق المرتبطة بالوباء ملايين الأمريكيين يتأقلمون فجأة مع العمل عن بُعد، وازداد استخدام أدوات مؤتمرات الفيديو.
تمامًا كما أصبح العمال الذين يعانون من ضجيج الخلفية في مكالمات الفيديو جزءًا من روح العصر الثقافي، طرحت Microsoft Teams أدوات لقمع الضوضاء وجودة الفيديو التي تعمل بالذكاء الاصطناعي في أواخر عام 2020 وأوائل عام 2021.
الآن، تواصل Microsoft Teams تحسين قدرات الذكاء الاصطناعي والتعلم الآلي لمساعدة أكثر من 270 مليون مستخدم شهريًا على التعامل مع بعض أكبر مشكلات مؤتمرات الفيديو – من الصدى المزعج إلى صعوبات التحدث في نفس الوقت.
قدرات جديدة مدعومة بالذكاء الاصطناعي والتعلم الآلي
أعلنت الشركة اليوم عن مجموعة جديدة من القدرات المدعومة بالذكاء الاصطناعي والتعلم الآلي المضمنة في البنية الأساسية لـ Teams.
يتضمن ذلك إلغاء الصدى، وضبط الصوت في المناطق الصوتية الضعيفة، والسماح للمستخدمين بالتحدث والاستماع في نفس الوقت دون انقطاع.
تعتمد هذه الميزات على الميزات التي تعمل بالذكاء الاصطناعي والتي تم إصدارها مؤخرًا، بما في ذلك توسيع قمع الضوضاء في الخلفية.
بالإضافة إلى ذلك، أعلنت Microsoft Teams للمرة الأولى عن تحسينات حديثة في جودة الفيديو، بما في ذلك تعديلات الإضاءة المنخفضة والتحسينات بناءً على نوع المحتوى الذي تتم مشاركته.
قال روبرت أيشنر، مدير إدارة المشاريع، المحادثة الذكية وسحابة الاتصالات (IC3) في Microsoft، لـ VentureBeat: “نحاول التأكد من أنه يمكنك إجراء مكالمتك أو اجتماعك أينما كنت، حتى لو كنت في بيئات” فوضوية “..
ايشنر الحاصل على دكتوراه. في معالجة الإشارات الصوتية، عمل في Microsoft على مدار العقد الماضي وأمضى السنوات الثلاث الماضية في قيادة فريق الذكاء الاصطناعي في Microsoft Teams، والذي يعمل على تطوير الأبحاث والأوساط الأكاديمية وشحنها إلى منتج.
تستخدم Microsoft Teams الذكاء الاصطناعي لمواجهة التحديات الصعبة
قال Aichner إن Microsoft Teams عرضت دائمًا منع الضوضاء. لكن الأساليب التقليدية كانت قادرة فقط على معالجة الضوضاء الثابتة – الضوضاء التي لا تتغير بمرور الوقت – مثل مراوح الكمبيوتر أو مكيفات الهواء.
الضوضاء الأخرى، مثل نباح الكلاب، أو صدى كاميرات الويب أو الميكروفونات أو مكبرات صوت سطح المكتب، هي صواميل أكثر صخبًا للتصدع. لذلك، أيضًا، التعامل مع غرف كبيرة أو غير مفروشة بالسجاد تجعل المستخدمين يبدون وكأنهم في كهف.
قال: “لقد عملنا دائمًا على إزالة الضوضاء – لطالما كانت مشكلة صعبة للغاية في معالجة الإشارات التقليدية”. ولكن مع التعلم الآلي، أصبح من السهل الآن على نماذج الذكاء الاصطناعي التعلم والتحسين.
على سبيل المثال، أثناء المكالمات والاجتماعات، عندما يكون ميكروفون أحد المشاركين قريبًا جدًا من مكبر الصوت، فمن الشائع أن يتكرر الصوت بين أجهزة الإدخال والإخراج، مما يتسبب في تأثير صدى غير مرغوب فيه.
الآن، تستخدم Microsoft Teams الذكاء الاصطناعي للتعرف على الفرق بين الصوت الصادر من مكبر الصوت وصوت المستخدم. هذا يلغي الصدى دون قمع الكلام أو تثبيط قدرة أطراف متعددة على التحدث في نفس الوقت.
ولتحقيق ذلك، كان لدى Microsoft 30000 ساعة من الكلام المسجل من المتحدثين الذكور والإناث في 74 لغة مختلفة، بالإضافة إلى محاكاة الصوت لصوتيات الغرفة، كما قال أيشنر.
بالإضافة إلى ذلك، في بعض البيئات، يمكن أن تتسبب صوتيات الغرفة في ارتداد الصوت أو ارتداده، مما يتسبب في جعل صوت المستخدم يبدو ضحلًا، كما لو كان في كهف.
لأول مرة، تستخدم Microsoft Teams نموذج التعلم الآلي لتحويل الإشارات الصوتية الملتقطة إلى صوت كما لو كان المستخدمون يتحدثون في ميكروفون قريب المدى.
يستخدم الذكاء الاصطناعي في Microsoft Teams التعلم الخاضع للإشراف
قال، “لقد أخذنا كثيرًا من الكلام النظيف، والذي يتم تسجيله كما لو كان لدي ميكروفون يتحدث عن قرب، ثم تركنا النموذج يتعلم كيف يتكيف مع ذلك ويزيل كل شيء آخر”، مشيرًا إلى أن هذا التعلم خاضع للإشراف – حيث توجد إشارة مستهدفة ويحاول النموذج تحسين ذلك.
وأوضح أن التعامل مع جودة الفيديو – مثل مشكلات الإضاءة السيئة – يتم التعامل معه بطريقة مماثلة: “لقد أشرفت على التعرف على شكل الإضاءة الجيدة، وكذلك الإضاءة السيئة، ثم تحتاج إلى نوع من التقييم جودة الإضاءة الجيدة مقابل تلك التي تحاول تحسينها “.
في الحالات التي لا يتوفر فيها عرض نطاق ترددي كافٍ لأعلى جودة للفيديو، يجب على المشفر إجراء مفاضلة بين جودة الصورة الأفضل مقابل معدل الإطارات الأكثر سلاسة.
لتسهيل الأمر على المستخدم النهائي، يستخدم Teams تعلم الآلة لفهم خصائص المحتوى الذي يشاركه المستخدم لضمان تجربة المشاركين لأعلى جودة للفيديو في سيناريوهات النطاق الترددي المقيد.
تقوم Microsoft Teams بإشراك الباحثين، وجهود المنتج المشتركة
إن الكثير مما أنجزته Microsoft Teams فيما يتعلق باستخدام الذكاء الاصطناعي والتعلم الآلي لتحسين جودة الصوت والفيديو هو نتيجة لجهودها التي بدأت في أوائل عام 2020 للتفاعل مع مجتمع البحث.
بدأ فريق Aichner مسابقة دولية كجزء من مؤتمري Interspeech 2020 وICASSP 2021، حيث يقدم “تحدي قمع الضوضاء التعلم العميق المصمم” لتعزيز الابتكار في مجال قمع الضوضاء لتحقيق جودة الكلام الإدراكي الفائقة.
” تدريب مفتوح المصدر لـ Microsoft Teams واختبار مجموعات البيانات للباحثين لتدريب نماذج قمع الضوضاء الخاصة بهم.
في هذه الأيام، يعمل باحثو Microsoft Teams أيضًا بالاشتراك مع فريق المنتج للعمل معًا والتأثير على العروض المستقبلية.
قال: “لدينا فرق مشتركة حيث نأخذ هذه النماذج ونقوم بدمجها بالفعل”. “أعتقد أن هذا أمر أساسي حقًا، لربط هذين الفريقين بحيث يحصلان على رؤيتهما من فريق المنتج ومعرفة ما يجب عليهما التركيز عليه – كما أن فرق المنتج أكثر وعيًا بمكان الثغرات، وأين لا تعمل. ”
المصدر: venturebeat
شاهد ايضا: