يطلق علماء معهد ماساتشوستس للتكنولوجيا محاكيًا واقعيًا مفتوح المصدر للقيادة الذاتية

كشف باحثو معهد ماساتشوستس للتكنولوجيا عن أول محرك محاكاة مفتوح المصدر قادر على بناء بيئات واقعية للتدريب القابل للنشر واختبار المركبات المستقلة.

نظرًا لأنهم أثبتوا أنهم أسرة اختبار منتجة لتجربة سيناريوهات القيادة الخطرة بأمان، فقد تم الإعلان عن العوالم الافتراضية شديدة الواقعية كأفضل مدارس لتعليم قيادة السيارات ذاتية القيادة (AVs). 

تعتمد شركات Tesla و Waymo وغيرها من الشركات ذاتية القيادة اعتمادًا كبيرًا على البيانات لتمكين المحاكات الواقعية الباهظة الثمن والخاصة بالملكية، لأن اختبار وجمع بيانات I شبه المعطلة الدقيقة ليست أسهل أو أكثر رغبة في إعادة إنشائها.

محاكيًا واقعيًا مفتوح المصدر

VISTA 2.0 هو محرك محاكاة مفتوح المصدر يمكنه إنشاء بيئات واقعية للتدريب واختبار السيارات ذاتية القيادة. الائتمان: الصورة مجاملة من MIT CSAIL

مع وضع ذلك في الاعتبار، أنشأ علماء من مختبر علوم الكمبيوتر والذكاء الاصطناعي (CSAIL) التابع لمعهد ماساتشوستس للتكنولوجيا “VISTA 2.0″، وهو محرك محاكاة يعتمد على البيانات حيث يمكن للمركبات تعلم القيادة في العالم الحقيقي والتعافي من سيناريوهات الاصطدام الوشيك. 

علاوة على ذلك، يتم إصدار جميع التعليمات البرمجية مفتوحة المصدر للجمهور.

“اليوم، الشركات فقط لديها برامج مثل نوع بيئات المحاكاة وقدرات VISTA 2.0، وهذا البرنامج مملوك. 

مع هذا الإصدار، سيتمكن مجتمع البحث من الوصول إلى أداة جديدة قوية لتسريع البحث والتطوير للتحكم القوي التكيفي للقيادة الذاتية، “حسب قول المؤلف الرئيسي لورقة بحثية حول البحث، أستاذ معهد ماساتشوستس للتكنولوجيا ومدير CSAIL دانييلا روس.


VISTA عبارة عن محاكي واقعي يعتمد على البيانات للقيادة الذاتية. يمكنه محاكاة ليس فقط الفيديو المباشر ولكن بيانات LiDAR وكاميرات الأحداث، وأيضًا دمج مركبات محاكاة أخرى لنمذجة مواقف القيادة المعقدة. 

VISTA مفتوح المصدر ويمكن العثور على الكود أدناه.

VISTA 2.0، الذي يبني على النموذج السابق للفريق، VISTA، يختلف اختلافًا جوهريًا عن محاكيات AV الحالية نظرًا لأنه يعتمد على البيانات. 

هذا يعني أنه تم إنشاؤه وعرضه بشكل واقعي من بيانات العالم الحقيقي – مما يتيح النقل المباشر إلى الواقع. 

في حين أن التكرار الأولي يدعم فقط تتبع مسار السيارة الفردي باستخدام مستشعر كاميرا واحد، فإن تحقيق محاكاة عالية الدقة تعتمد على البيانات يتطلب إعادة التفكير في أسس كيفية تصنيع أجهزة الاستشعار المختلفة والتفاعلات السلوكية.

أدخل VISTA 2.0: نظام يعتمد على البيانات يمكنه محاكاة أنواع أجهزة الاستشعار المعقدة والسيناريوهات والتقاطعات التفاعلية على نطاق واسع. باستخدام بيانات أقل بكثير من النماذج السابقة، تمكن الفريق من تدريب المركبات المستقلة التي يمكن أن تكون أكثر قوة بشكل كبير من تلك المدربة على كميات كبيرة من بيانات العالم الحقيقي.

يقول ألكساندر أميني، طالب الدكتوراه في CSAIL والمؤلف الرئيسي المشارك في ورقتين جديدتين: “هذه قفزة هائلة في قدرات المحاكاة المستندة إلى البيانات للمركبات ذاتية القيادة، بالإضافة إلى زيادة الحجم والقدرة على التعامل مع تعقيد القيادة الأكبر”.

مع زميله طالب الدكتوراه Tsun-Hsuan Wang. “يوضح VISTA 2.0 القدرة على محاكاة بيانات المستشعر إلى ما هو أبعد من كاميرات 2D RGB، ولكن أيضًا ليدار ثلاثي الأبعاد عالي الأبعاد بملايين النقاط، وكاميرات قائمة على الأحداث غير منتظمة التوقيت، وحتى السيناريوهات التفاعلية والديناميكية مع المركبات الأخرى أيضًا.”

كان فريق العلماء قادراً على قياس مدى تعقيد مهام القيادة التفاعلية لأشياء مثل التجاوز والمتابعة والتفاوض، بما في ذلك السيناريوهات متعددة الوكلاء في بيئات عالية الواقعية.

نظرًا لأن معظم بياناتنا (لحسن الحظ) هي مجرد قيادة عادية، وقيادة يومية، فإن تدريب نماذج الذكاء الاصطناعي للمركبات ذاتية القيادة يتضمن علفًا يصعب تأمينه لأنواع مختلفة من الحالات المتطورة والسيناريوهات الغريبة والخطيرة. 

منطقياً، لا يمكننا فقط الاصطدام بسيارات أخرى فقط لتعليم الشبكة العصبية كيفية عدم الاصطدام بالسيارات الأخرى.

في الآونة الأخيرة، كان هناك تحول بعيدًا عن بيئات المحاكاة الأكثر كلاسيكية والمصممة بشريًا إلى تلك التي تم إنشاؤها من بيانات العالم الحقيقي. 

هذا الأخير يتمتع بواقعية هائلة، لكن الأول يمكنه بسهولة نمذجة الكاميرات الافتراضية و lidars. مع هذا التحول النموذجي، ظهر سؤال رئيسي: هل يمكن تخليق ثراء وتعقيد جميع المستشعرات التي تحتاجها المركبات ذاتية القيادة، مثل الكاميرات التي تعتمد على الأحداث والكاميرات الأكثر ندرة، بدقة؟

يصعب تفسير بيانات مستشعر Lidar في عالم يعتمد على البيانات – فأنت تحاول بفاعلية إنشاء سحب نقطية ثلاثية الأبعاد جديدة تمامًا بملايين النقاط، فقط من مناظر متفرقة للعالم. 

لتجميع سحب نقطة ليدار ثلاثية الأبعاد، استخدم الباحثون البيانات التي جمعتها السيارة، وعرضوها في مساحة ثلاثية الأبعاد قادمة من بيانات الليدار ، ثم تركوا مركبة افتراضية جديدة تتجول محليًا من مكان وجود تلك السيارة الأصلية. 

أخيرًا، قاموا بإسقاط كل تلك المعلومات الحسية مرة أخرى في إطار رؤية هذه السيارة الافتراضية الجديدة، بمساعدة الشبكات العصبية.

جنبًا إلى جنب مع محاكاة الكاميرات القائمة على الأحداث، والتي تعمل بسرعات أكبر من آلاف الأحداث في الثانية، كان المحاكي قادرًا ليس فقط على محاكاة هذه المعلومات متعددة الوسائط ولكن أيضًا القيام بذلك كله في الوقت الفعلي. 

هذا يجعل من الممكن تدريب الشبكات العصبية في وضع عدم الاتصال، ولكن أيضًا الاختبار عبر الإنترنت على السيارة في إعدادات الواقع المعزز لإجراء تقييمات آمنة. 

يقول أميني: “كان السؤال عما إذا كانت محاكاة أجهزة الاستشعار المتعددة بهذا الحجم من التعقيد والواقعية ممكنة في عالم المحاكاة القائمة على البيانات سؤالًا مفتوحًا إلى حد كبير”.

مع ذلك، تصبح مدرسة القيادة حفلة. في المحاكاة، يمكنك التنقل، ولديك أنواع مختلفة من وحدات التحكم، ومحاكاة أنواع مختلفة من الأحداث، وإنشاء سيناريوهات تفاعلية، وإسقاط سيارات جديدة تمامًا لم تكن موجودة حتى في البيانات الأصلية. 

لقد اختبروا تتبع المسار، واستدارة المسار، ومتابعة السيارة، والمزيد من السيناريوهات المشبوهة مثل التجاوز الثابت والديناميكي (رؤية العوائق والتحرك حتى لا تصطدم). 

مع الوكالات المتعددة، يتفاعل كل من الوكلاء الحقيقيين والمحاكين، ويمكن إسقاط وكلاء جدد في المشهد والتحكم بأي طريقة.

أخذ سيارتهم كاملة الحجم إلى “البرية” – المعروفة أيضًا باسم Devens ، ماساتشوستس – رأى الفريق قابلية نقل فورية للنتائج، مع كل من الإخفاقات والنجاحات. 

وتمكنوا أيضًا من إظهار الكلمة السحرية الجريئة لموديلات السيارات ذاتية القيادة: “قوية”. أظهروا أن المركبات ذاتية القيادة، المدربة بالكامل على VISTA 2.0، كانت قوية جدًا في العالم الحقيقي بحيث يمكنها التعامل مع هذا الذيل المراوغ من الإخفاقات الصعبة.

الآن، أحد الحواجز التي يعتمد عليها البشر ولا يمكن محاكاته بعد هو المشاعر الإنسانية. إنها الموجة الودودة أو الإيماءة أو التبديل الوامض للاعتراف، وهي نوع الفروق الدقيقة التي يريد الفريق تنفيذها في العمل المستقبلي.

يقول أميني: “الخوارزمية المركزية لهذا البحث هي كيف يمكننا أن نأخذ مجموعة بيانات ونبني عالمًا اصطناعيًا بالكامل للتعلم والاستقلالية”. 

“إنها منصة أعتقد أنها ذات يوم يمكن أن تمتد في العديد من المحاور المختلفة عبر الروبوتات. ليس فقط القيادة الذاتية، ولكن العديد من المجالات التي تعتمد على الرؤية والسلوكيات المعقدة. 

نحن متحمسون لإصدار VISTA 2.0 للمساعدة في تمكين المجتمع من جمع مجموعات البيانات الخاصة بهم وتحويلها إلى عوالم افتراضية حيث يمكنهم مباشرة محاكاة مركباتهم الافتراضية المستقلة، والقيادة حول هذه التضاريس الافتراضية، وتدريب المركبات المستقلة في هذه العوالم، ثم يمكن نقلها مباشرة إلى سيارات كاملة الحجم وذاتية القيادة “.

المصدر: scitechdaily

شاهد ايضا:

افضل شركات استضافة المواقع

أفضل شركة خدمات سيو

ترجمة هولندي عربي

استضافة ووردبريس مجانية

سيو

أنت تستخدم إضافة Adblock

يعتمد موقع انشاء على الاعلانات كمصدر لدعم الموقع، يجب عليك ايقاف تشغيل حاجب الاعلانات لمشاهدة المحتوي