تصدر Meta مجموعة بيانات جديدة لمساعدة الباحثين في مجال الذكاء الاصطناعي على زيادة الشمول والتنوع في مشاريعهم

تتطلع Meta إلى مساعدة الباحثين في مجال الذكاء الاصطناعي على جعل أدواتهم وعملياتهم أكثر شمولاً عالميًا، من خلال إصدار مجموعة بيانات جديدة ضخمة من مقاطع الفيديو وجهًا لوجه، والتي تشمل مجموعة واسعة من الأفراد المتنوعين، وستساعد المطورين على تقييم مدى جودة نماذجهم العمل لمجموعات ديموغرافية مختلفة.

كما ترى في هذا المثال، تتضمن قاعدة بيانات Meta العرضية للمحادثات v2 26467 مونولوج فيديو، مسجلة في سبع دول، وتضم 5،567 مشاركًا مدفوع الأجر، مصحوبة ببيانات سمات الكلام والبصرية والديموغرافية لقياس الفعالية المنهجية.

″ تم إعلام وتشكيل مجموعة البيانات القائمة على الموافقة من خلال مراجعة شاملة للأدبيات حول الفئات الديموغرافية ذات الصلة، وتم إنشاؤها بالتشاور مع خبراء داخليين في مجالات مثل الحقوق المدنية. تقدم مجموعة البيانات هذه قائمة محببة من 11 فئة مقدمة ذاتيًا ومشروحة لمزيد من قياس عدالة الخوارزميات وقوتها في أنظمة الذكاء الاصطناعي هذه. على حد علمنا، إنها أول مجموعة بيانات مفتوحة المصدر تحتوي على مقاطع فيديو تم جمعها من بلدان متعددة باستخدام معلومات ديموغرافية عالية الدقة ومفصلة للمساعدة في اختبار نماذج الذكاء الاصطناعي من حيث الإنصاف والمتانة. ″

لاحظ” الموافقة المدفوعة”. إن Meta واضح جدًا أن هذه البيانات تم الحصول عليها بإذن مباشر من المشاركين، ولم يتم الحصول عليها سرًا. لذلك، لا يتم أخذ معلومات Facebook الخاصة بك أو تقديم صور من IG – تم تصميم المحتوى المتضمن في مجموعة البيانات هذه لزيادة التضمين إلى أقصى حد من خلال منح الباحثين في الذكاء الاصطناعي المزيد من عينات الأشخاص من مجموعة واسعة من الخلفيات لاستخدامها في نماذجهم.

ومن المثير للاهتمام، أن غالبية المشاركين يأتون من الهند والبرازيل، وهما اقتصادا رقميان ناشئان سيلعبان أدوارًا رئيسية في المرحلة التالية من تطوير التكنولوجيا.

تصدر Meta مجموعة بيانات جديدة

ستساعد مجموعة البيانات الجديدة مطوري الذكاء الاصطناعي على معالجة المخاوف المتعلقة بحواجز اللغة، إلى جانب التنوع المادي، الذي كان يمثل مشكلة في بعض سياقات الذكاء الاصطناعي.

على سبيل المثال، فشلت بعض أدوات التراكب الرقمي في التعرف على سمات معينة للمستخدم بسبب القيود في نماذج التدريب الخاصة بهم، في حين تم تصنيف البعض على أنهم عنصريون تمامًا، ويرجع ذلك جزئيًا على الأقل إلى قيود مماثلة.

هذا هو التركيز الرئيسي في توثيق Meta لمجموعة البيانات الجديدة:

″مع تزايد المخاوف بشأن أداء أنظمة الذكاء الاصطناعي عبر مقاييس ألوان البشرة المختلفة، قررنا الاستفادة من مقياسين مختلفين لتعليقات لون البشرة. الأول هو مقياس فيتزباتريك بست درجات، وهو مخطط التصنيف العددي الأكثر استخدامًا للون البشرة نظرًا لبساطته وانتشاره على نطاق واسع. والثاني هو مقياس درجة لون البشرة ذو الـ 10 نغمات، والذي قدمته شركة Google ويستخدم في خدمات البحث والصور الخاصة بها. يوفر تضمين كلا المقياسين في المحادثات العرضية الإصدار 2 مقارنة أوضح مع الأعمال السابقة التي تستخدم مقياس فيتزباتريك مع تمكين القياس على أساس مقياس الراهب الأكثر شمولاً. ″

إنه اعتبار مهم، خاصة وأن أدوات الذكاء الاصطناعي التوليدية تستمر في اكتساب الزخم، وترى زيادة الاستخدام عبر العديد من التطبيقات والأنظمة الأساسية. من أجل تحقيق أقصى قدر من التضمين، يجب تدريب هذه الأدوات على مجموعات البيانات الموسعة، مما يضمن مراعاة الجميع في أي تطبيق من هذا القبيل، وكشف أي عيوب أو سهو قبل الإصدار.

ستساعد مجموعة بيانات Meta العرضية للمحادثات في هذا الأمر، ويمكن أن تكون مجموعة تدريب ذات قيمة كبيرة للمشاريع المستقبلية.

المصدر: socialmediatoday

قد يهمك:

شرح خطوات انشاء حساب بايير

فتح حساب باي بال

خطوات إنشاء محفظة USDT

خطوات انشاء محفظة بيتكوين

فتح حساب Apple ID

إنشاء متجر الكتروني مجاني مدى الحياة

فروع الذكاء الاصطناعي

أفضل استضافة مواقع

التسويق الالكتروني

تحميل واتس اب الذهبي

أنت تستخدم إضافة Adblock

يعتمد موقع انشاء على الاعلانات كمصدر لدعم الموقع، يجب عليك ايقاف تشغيل حاجب الاعلانات لمشاهدة المحتوي