يوسع Roboflow مجموعات البيانات مفتوحة المصدر للحصول على نماذج ذكاء اصطناعي أفضل لرؤية الكمبيوتر

تعتمد جميع مكتبات ومشاريع التعلم الآلي على البيانات للتعلم والتدريب والتشغيل.
في محاولة لمساعدة المطورين على الاستفادة بسهولة أكبر من مجموعات البيانات ذات العلامات ونماذج التعلم الآلي لرؤية الكمبيوتر، أعلنت Roboflow اليوم عن توسيع مجموعات البيانات ونماذج الذكاء الاصطناعي كجزء من مبادرة Roboflow Universe الخاصة بها، والتي يمكن أن تكون واحدة من أكبر هذه- مستودعات المصدر المتاحة.
تدعي Roboflow أن لديها الآن أكثر من 90.000 مجموعة بيانات تتضمن أكثر من 66 مليون صورة في خدمة Roboflow Universe التي تم إطلاقها في أغسطس 2021.
تأسست Roboflow في عام 2019 وجمعت 20 مليون دولار في جولة تمويل من السلسلة A في سبتمبر 2021.
توفر Roboflow مستودع الكون مفتوح المصدر لمجموعات البيانات والنماذج لرؤية الكمبيوتر بالإضافة إلى وضع العلامات على البيانات وتطوير النماذج وقدرات الاستضافة.
يتمثل نموذج أعمال Roboflow في توفير مستويات مجانية من الخدمة للمستخدمين على مستوى الدخول، وبعد ذلك مع نمو الاستخدام، أو بالنسبة لتلك المؤسسات التي تعمل مع مجموعات خاصة، توفر الشركة خيارات دعم وخدمة مدفوعة.
لا يتعلق Roboflow Universe بمجرد توفير الصور التي يمكن للمطور استخدامها؛ يتعلق الأمر بتوفير الصور التي يتم تنسيقها بأسلوب يتيح استخدام مجموعات البيانات للتطبيقات التي تعمل بالذكاء الاصطناعي.
قال جوزيف نيلسون، المؤسس المشارك والرئيس التنفيذي لـ VentureBeat: “المشروع هو في الأساس شيء يحتوي على مجموعة بيانات يمكن لأي شخص استخدامها ونموذج مدرب فوق مجموعة البيانات هذه”.
“مجموعة البيانات هي الصور بالإضافة إلى التعليقات التوضيحية”.
البيانات جميلة، والبيانات المصنفة أجمل
قال نيلسون إن المؤسسات عادةً ما تقضي وقتًا طويلاً في إعداد بيانات التعلم الآلي.
تتضمن عملية إعداد البيانات وسم البيانات وتصنيفها، بحيث يمكن تدريب النموذج بشكل فعال. قال نيلسون إن وضع العلامات في Roboflow Universe ليس مجرد وصف للصورة أيضًا.
الملصقات التي يمكن أن يتضمنها Roboflow Universe لمجموعة بيانات معينة هي أشياء مثل الصندوق المحيط، والذي يوفر مربعًا حول كائن ما، والذي يمكن أن يكون مفيدًا لاكتشاف الكائن في المناظر الطبيعية المزدحمة.
هناك نوع آخر من العلامات التي يقوم بها Roboflow وهو تجزئة المثيل، والذي يوفر شكلًا مضلعًا يرسم بدقة حول الكائن محل الاهتمام.
غالبًا ما تكون تنسيقات تصنيف البيانات المستخدمة في التعلم الآلي معقدة ومتنوعة. تحقيقًا لهذه الغاية، قال نيلسون إن Roboflow يدعم تصدير مجموعة البيانات إلى 36 تنسيقًا لتعليقات توضيحية للبيانات.
من بين التنسيقات المدعومة COCO JSON وVOC XML وتنسيق YOLO Darknet TXT.
قال نيلسون: “إن إتاحة بيانات الصورة على نطاق واسع وقابلة للاستخدام يعني أنه يمكن لأي شخص العثور على مجموعة بيانات على الفور، وسحبها إلى خط أنابيب التدريب، والاستيقاظ والاستمرار”.
كيف يقوم المطورون بدمج مجموعات بيانات Roboflow Universe في التطبيقات
غالبًا ما يكون جلب مجموعات بيانات ونماذج رؤية الكمبيوتر إلى التطبيقات التي تعمل بالذكاء الاصطناعي تكاملاً معقدًا.
هدف نيلسون مع Roboflow هو المساعدة في تقليل التعقيد. قال إنه يمكن الوصول إلى مجموعات بيانات Roboflow Universe عبر واجهات برمجة التطبيقات المفتوحة.
على سبيل المثال، أشار إلى أن Roboflow لديه حزمة Python مستضافة على Python Package Index ( PyPI ) والتي تمكن المطورين من سحب الصور والتعليقات التوضيحية والنماذج برمجيًا ثم تضمين هذه المكونات مباشرةً في أحد التطبيقات.
يعد نشر نموذج Roboflow Universe في خدمات التعلم الآلي السحابية الشائعة، بما في ذلك AWS Sagemaker أو Google Vertex أيضًا عملية مباشرة عبر استدعاء واجهة برمجة التطبيقات، وفقًا لنيلسون.
بالإضافة إلى ذلك، يوفر Rob flow مجموعات البيانات والنماذج كحاويات Docker، مما يتيح النشر على الأجهزة المتطورة. هناك أيضًا مجموعة تطوير البرامج (SDK) لدعم أجهزة Apple iOS أيضًا.
قال نيلسون: “إذا جعلنا من السهل جدًا استخدام نموذج أينما تريد استخدامه، فمن الناحية المثالية، يركز المهندس وقته على الشيء الذي يفعله منطق أعماله بالفعل”.
تقاطع نماذج المصادر المفتوحة مع انحياز الذكاء الاصطناعي
يعد تسهيل الوصول إلى مجموعات البيانات والنماذج الخاصة برؤية الكمبيوتر لإنشاء التطبيقات هدفًا رئيسيًا لـ Rob flow.
هناك تأثير آخر لامتلاك مثل هذا الكم الهائل من البيانات مفتوحة المصدر وهو المساعدة في تحسين مخاوف التحيز للذكاء الاصطناعي.
قال نيلسون: “التحيز في الذكاء الاصطناعي ليس مشكلة محلولة أبدًا”. “ولكن توفير إمكانية الشرح وإمكانية الوصول والاكتشاف يمكن أن يساعد.”
أوضح نيلسون أن تحيز الذكاء الاصطناعي غالبًا ما يتعلق بمحاولة فهم سبب اتخاذ نموذج لقرار معين. في الأساس، تعتمد الطريقة التي تتخذ بها النماذج القرارات على البيانات التي يتم تدريب النماذج عليها.
من خلال وجود مجموعة بيانات أكبر تتضمن المزيد من التنوع، يمكن أن يصبح النموذج أكثر تمثيلاً، مع مخاطر أقل للتحيز.
قال نيلسون: “في النهاية، تنبع الكثير من مشكلات التحيز في الذكاء الاصطناعي من التمثيل الناقص”.
“تتمثل الطريقة لإصلاح نقص التمثيل في تمكين الجمع النشط لمجموعات البيانات للفئة الممثلة تمثيلا ناقصًا، وجعل هذه البيانات قابلة للوصول وقابلة للبحث والاستخدام.”
المصدر: venturebeat
شاهد ايضا: