تفوقت Intel Habana على Nvidia في أحدث نتائج MLPerf

تفوقت شركة Habana من Intel على Nvidia في أحدث نتائج اختبار MLPerf، والتي أصبحت مجموعة معايير الصناعة القياسية لمقارنة مسرعات الذكاء الاصطناعي.
على الرغم من أن Nvidia قد أعلنت بالفعل عن الجيل التالي من GPU، إلا أن النتائج تشير إلى أن المنافسة في أجهزة التدريب على التعلم العميق تتزايد.
استحوذت إنتل على شركة هابانا الناشئة في أواخر عام 2019 مقابل 2 مليار دولار، وفي أواخر العام الماضي، تم إطلاق الجيل الأول من غاودي NPU (وحدة المعالجة العصبية) 16 نانومتر في سحابة أمازون AWS، مدعياً أن أداء كل دولار أعلى بنسبة 40٪ من مثيلات Nvidia.
ومع ذلك، نظرًا لأنها كانت تنافس 7nm A100 من Nvidia، فقد حققت Habana غالبًا قيمتها من خلال فرض سعر أقل، وليس عن طريق التغلب على Nvidia على الأداء.
تغير هذا في مايو عندما أعلن Habana عن Gaudi2 على 7 نانومتر، مما زاد عدد نوى معالجة الموتر بمقدار 3x ويوفر ما يصل إلى 96 جيجابايت من HBM2e.
ادعى هابانا أنها تفوقت على A100، وحدة معالجة الرسومات (GPU) الرائدة في مركز البيانات منذ عامين من Nvidia، بهامش مريح.
جاء الإطلاق في الوقت المناسب ليتم تضمينه في أحدث نتائج MLPerf، وهي محاولة الصناعة لتوحيد معايير التعلم العميق.
نتائج الأداء
قال هابانا إنه كان أمامه 10 أيام فقط منذ الإطلاق لتقديم نتائجه، لذلك لم يكن قادرًا على إجراء جميع الاختبارات الثمانية، وركز فقط على اثنين من المعايير الأكثر شهرة: ResNet-50 (التعرف على الصور) وBERT (اللغة الطبيعية) يعالج). تخضع عمليات إرسال MLPerf لعملية مراجعة الأقران لمدة شهر.
قال هابانا أيضًا إن الوقت القصير يعني أنه لم يكن لديه الوقت لإجراء تحسينات شاملة للبرامج. على سبيل المثال، أضاف Gaudi2 دعمًا لتنسيق FP8 جديد منخفض الدقة، والذي لم يتم استخدامه في الإرسال.
بدلاً من ذلك، اختارت Habana تقديم النتائج بناءً على نفس البرنامج المتاح لجميع عملاء Habana، في حين يُزعم أن Nvidia تستخدم تحسينات غير متوفرة في برنامجها المتاح للعملاء.
هذا يعني أن فرق الأداء في الحالات غير المحسّنة أكبر. في اختبارات Habana الخاصة باستخدام المستودعات العامة في مثيلات Azure، قاس هابانا أن Gaudi2 كان على الأقل مرتين أسرع على كل من ResNet-50 وBERT من A100.
يجادل هابانا بأن هذه النتائج أكثر تمثيلا للأداء الجاهز الذي سيراه العملاء باستخدام البرامج المتاحة للجمهور.
في نتائج MLPerf، مقارنةً بتقديم Nvidia، كان Gaudi2 قادرًا على تدريب ResNet-50 في وقت أقل بنسبة 36٪، وهو ما يُترجم إلى أداء أعلى بنسبة 56٪.
ومع ذلك، يمكن ملاحظة أن نتائج MLPerf لبدء التعلم العميق، والتي استخدمت PyTorch، قدمت وقت تدريب قدره 23.8 دقيقة تفوقت على تقديم Nvidia، على الرغم من أنها لا تزال أبطأ من Gaudi2.
من ناحية أخرى، قد تؤدي تحسينات البرامج الإضافية أيضًا إلى تقليل وقت Gaudi2 في الإرسال المستقبلي.
في BERT، كان الانتصار أصغر حيث أخذ Gaudi2 وقتًا أقل بنسبة 7٪ من A100. مقارنة بـ Gaudi، كان Gaudi2 أسرع 3x و4.7x على التوالي في ResNet-50 وBERT.
تستند نتائج جميع المسرّعات إلى خوادم مكونة من 8 بطاقات. أظهر Habana أيضًا نتائج لنظام يحتوي على 256 مركزًا، والذي يوفر أداءً أعلى بما يقرب من 25 ضعفًا، مقارنةً بحد القياس النظري 32x، مما يدل على أن الأداء يتم الحفاظ عليه في تكوينات التدرج التي يتم نشر هذه الشرائح فيها غالبًا.
ماذا بعد
كانت أطروحة معظم الشركات الناشئة في مجال الذكاء الاصطناعي هي أنه يمكنها التغلب على Nvidia من خلال التخلص من جميع عناصر GPU والتركيز فقط على أجهزة AI.
على الرغم من أنه لم يكن أمامه سوى بضعة أيام لتقديم نتائجه منذ الإطلاق الرسمي، إلا أن جهاز Gaudi2 من Habana قد تغلب على Nvidia’s A100، وكلاهما تم تصنيعهما باستخدام تقنية معالجة 7 نانومتر، باستخدام أجهزة جاهزة وبرامج متاحة تجاريًا.
يدعي Habana أيضًا أن فرق الأداء في الكود غير المحسّن، خارج MLPerf، يمكن أن يزيد عن 2x. نظرًا لأنه من المرجح أن تقوم Habana بتسعير Gaudi2 الخاص بها أقل من Nviida’s A100، وتحتوي كل شريحة Gaudi أيضًا على 24 منفذ إيثرنت 100G متكامل، قد يكون الفرق في التكلفة الإجمالية للملكية أكبر، كما يدعي Habana وAWS بالفعل هو الحال بالنسبة لأول- جيل غاودي.
في حين أن Habana ربما تكون قد فازت بتتويج الأداء في هذه الجولة، فقد أعلنت Nvidia بالفعل عن الجيل التالي من H100 مع توفرها في وقت لاحق من هذا العام. لم تعلن Habana أيضًا عن أي حالات سحابية لـ Gaudi2 حتى الآن.
المصدر: venturebeat
إقراء ايضا: