يسهِّل Landing AI من Andrew Ng إنشاء تطبيقات رؤية الكمبيوتر باستخدام Visual Prompting

أعلنت شركة Landing AI، وهي شركة تقدم برامج وحلول تحول على مستوى المؤسسة لتطبيقات الذكاء الاصطناعي الصناعية، اليوم عن إطلاق Visual Prompting، الذي يساعد على تسهيل بناء تطبيقات الرؤية الحاسوبية على المستخدمين.

اجتمع VentureBeat مع Andrew Ng ، المؤسس والرئيس التنفيذي لشركة Landing AI والمعروف في جميع أنحاء العالم بمعرفته وخبرته في مجال الذكاء الاصطناعي. 

بالإضافة إلى معرفة المزيد عن أداة Visual Prompting الجديدة من Landing AI، ناقشنا كيف أن الذكاء الاصطناعي التوليفي يلهم الابتكارات في مجالات أخرى من الذكاء الاصطناعي، وخاصة التعلم الآلي.

قال إن جي إن قدرة الشركة على التعجيل المرئي تبسط وتسرع إنشاء نماذج رؤية الكمبيوتر. 

مع هذا التحول الكبير في سير عمل تطوير الذكاء الاصطناعي، يمكن للمطورين الاستفادة من الإشارات المرئية لتسمية البيانات بسرعة وكفاءة، مما يقلل الوقت اللازم لهذه الخطوة الحاسمة. 

كيف يعمل Visual Prompting

“في سير العمل الفوري، يمكنك التوصل إلى” موجه مرئي “بسيط، وفي ثوانٍ، يمكنك البدء في الحصول على تنبؤات. 

هذا يتيح سرعة تطوير التطبيقات بشكل أسرع بكثير، “قال نج لـ VentureBeat. “لحظة GPT-3 – حيث تسهل المطالبة تطوير تطبيقات جديدة – ليست موجودة بعد من أجل رؤية الكمبيوتر، لكنني أعتقد أن المطالبات المرئية ستقربنا.”

وأوضح أن تقنية Visual Prompting تمكن المستخدمين من تحديد موجه مرئي من خلال الرسم فوق فئات الكائنات التي يرغبون في أن يكتشفها النظام، باستخدام صورة واحدة فقط أو بضع صور. 

ثم تبدأ الخوارزمية فورًا في عمل استنتاجات بناءً على الموجه المقدم من المستخدم. 

إذا كانت النتائج الأولية دون المستوى، يمكن للمستخدمين إعادة إدخال الموجه على الفور لتحسين نماذجهم، وتوجيه نظام الذكاء الاصطناعي نحو التعرف بشكل أفضل من خلال إبراز وحدات البكسل المحددة التي يرغبون في تحسينها.

لقطة شاشة من Landing AI demo for Visual Promptingلقطة شاشة لإصدار “Cell” من العرض التوضيحي لـ Landing AI’s Visual Prompting. مصدر الصورة: Landing AI.

يعد Visual Prompting إحدى ميزات LandingLens، المنتج الرئيسي للشركة الذي يجعل رؤية الكمبيوتر سهلة التنفيذ للجميع. 

LandingLens هي عبارة عن منصة برمجية بديهية تتيح للمستخدمين إنشاء ونشر وتوسيع نطاق تطبيقات الرؤية الحاسوبية الصناعية التي تعمل بالذكاء الاصطناعي – مثل اكتشاف العيوب – بشكل أسرع وبدقة أعلى.

كيف ألهم الذكاء الاصطناعي التوليدي أداة Landing AI الجديدة

التكنولوجيا الجديدة مستوحاة من التطورات الحديثة في واجهات نصوص الذكاء الاصطناعي التوليدية مثل ChatGPT ، والتي تبسط عملية تكرار النص لاكتساب رؤى قيمة. 

تقليديا، كان بناء نماذج الذكاء الاصطناعي (AI) مسعى معقدًا وطويلًا، وغالبًا ما يتضمن خطوات متعددة مثل وسم البيانات، والتدريب على النموذج والنشر قبل الحصول على أي تنبؤات. 

ولكن تم إنشاء Visual Prompting لتغيير طريقة إنشاء أنظمة الرؤية الحاسوبية. 

قال نج “هذه الوظيفة القوية تمكن المستخدمين من ضبط نماذجهم بسهولة، مما ينتج عنه تكرارات أسرع ودقة أكبر”. 

“إذا بدت النتائج جيدة، يمكنك أيضًا النشر إلى نقطة نهاية واجهة برمجة التطبيقات السحابية في السحابة، ربما في غضون عشرات الثواني. 

هذا يعني أنه يمكنك الحصول على النموذج الأول وتشغيله ربما في دقائق أو، على الأكثر، في عدد قليل من الساعات، واستخدام ذلك لمواصلة التكرار وتحسين أدائه “.

ما وراء ChatGPT: تطبيق البرمجة اللغوية العصبية على رؤية الكمبيوتر

يعتقد Ng أن نجاح تحفيز النص في تحويل معالجة اللغة الطبيعية (NLP) قد مهد الطريق للابتكار المتفجر في مجال رؤية الكمبيوتر.

“تستكشف العديد من المجموعات في مجال رؤية الكمبيوتر كيفية أخذ أفكار النص المحفز وتكييفها مع الرؤية. 

على سبيل المثال، كان عمل Meta الأخير على SAM (Segment Anything Model) عملاً رائعًا على استخدام التحفيز لمهمة تجزئة الصورة. 

“لا يزال هناك الكثير من العمل في المستقبل، وأتوقع أن تستمر هذه التكنولوجيا في التحسن سريعًا من خلال عملنا وعمل العديد من الآخرين.”

كجزء من هذا العمل التوسعي، تختبر Landing AI أداة Visual Prompting الخاصة بها عبر صناعات متعددة لحالات استخدام مختلفة. 

في أحد الأمثلة، استخدمت شركة أدوية رائدة متعددة الجنسيات هذه التقنية لتقدير شكل البلورات والنمو من الصور المختبرية. وقد مكنهم ذلك من تطوير نماذج على مجموعة بيانات صغيرة أثناء إزالة عبء التعليقات التوضيحية.

في الآونة الأخيرة، استخدمت شركة اكتشاف الأجسام المضادة العلاجية OmniAb منصة LandingLens مع Visual Prompting لتحليل الخلايا الفردية في أقراص العسل. 

عملية كانت في الماضي تتطلب عمومًا ساعات لإكمالها عن طريق لصق مئات الأشكال السداسية يدويًا. 

قال بوب تشين، كبير المديرين في OmniAb، في بيان صحفي: “كان التأثير الأكبر للتوجيه المرئي في حالات الاستخدام حيث سيكون من الصعب تصنيف جميع الميزات بشكل شامل، مثل الخلايا في نظامنا للفحص عالي الإنتاجية”. 

“بفضل الواجهة السريعة البديهية لـ Visual Prompting ، يمكننا تحقيق نتائج عالية الجودة في جزء صغير من الوقت وبجهد أقل بشكل ملحوظ.”

التحديات الحالية وخطط الهبوط المستقبلية للذكاء الاصطناعي

يقول Ng أن البرنامج لا يعمل على كل شيء لأنه إصدار تجريبي. ومع ذلك، من بين 40 حالة استخدام قامت Landing AI بتحليلها، كانت Visual Prompting وقدراتها اللاحقة للمعالجة كافية لأكثر من ثلثيها. 

“أحد قيود نظامنا الحالي هو أنه أفضل في التمييز بين الفئات ذات القوام / الألوان المختلفة من ميزات الشكل؛ هذا يعكس محدودية محولات الرؤية المسبقة التي نستخدمها “. “نحن نواصل العمل على تحسين النظام.” 

قال نج: “سنستمر في تحسين Visual Prompting ونحرص على المشاركة مع المجتمع لمواصلة تطوير هذه التكنولوجيا معًا”. “مع تحسن محولات الرؤية، سنواصل أيضًا البحث في كيفية دمج أحدث الأفكار لمساعدة عملائنا بشكل أكبر.”

أداة Landing AI’s Visual Prompting متاحة كإصدار تجريبي عام الآن. تدعو الشركة الأشخاص إلى عرض الأداة على موقعها على الويب ومعرفة كيفية عملها لضبط نماذج الذكاء الاصطناعي.

المصدر: venturebeat

إقراء ايضا:

إنشاء حساب موقع PayPal

إنشاء حساب موقع Payeer

إنشاء حساب موقع خمسات

انشاء حساب موقع صراحة

انواع الجرائم الالكترونية

إنشاء حساب فيس بوك

انشاء حساب انستقرام

دليل سيو SEO | تحسين محركات البحث 2023

أنت تستخدم إضافة Adblock

يعتمد موقع انشاء على الاعلانات كمصدر لدعم الموقع، يجب عليك ايقاف تشغيل حاجب الاعلانات لمشاهدة المحتوي