صنعت DeepMind اسم AI الخاص بها في الألعاب. الآن هو اللعب بأسس الحوسبة

لم يكن المعمل يلعب الشطرنج فقط من أجل المتعة
طبقت DeepMind إتقانها للألعاب في عمل أكثر جدية: أسس علوم الكمبيوتر.
كشفت شركة Google الفرعية اليوم عن نظام AlphaDev ، وهو نظام ذكاء اصطناعي يكتشف خوارزميات أساسية جديدة. وفقًا لـ DeepMind ، فإن الخوارزميات التي تم اكتشافها تفوق تلك التي شحذها الخبراء البشريون على مدى عقود.
يمتلك المختبر الذي يتخذ من لندن مقراً له طموحات كبيرة للمشروع.
مع تزايد الطلب على الحوسبة واقتراب رقائق السيليكون من حدودها، يجب أن تصبح الخوارزميات الأساسية أكثر كفاءة بشكل كبير. من خلال تعزيز هذه العمليات، يهدف DeepMind إلى تحويل البنية التحتية للعالم الرقمي.
الهدف الأول في هذه المهمة هو فرز الخوارزميات، والتي تستخدم لترتيب البيانات. تحت أغلفة أجهزتنا، يحددون كل شيء من تصنيفات البحث إلى توصيات الأفلام.
لتحسين أدائهم، استكشف AlphaDev تعليمات التجميع، والتي تُستخدم لإنشاء رمز ثنائي لأجهزة الكمبيوتر. بعد بحث شامل، كشف النظام عن خوارزمية فرز تفوقت على المعايير السابقة.
للعثور على المجموعة الفائزة، كان على DeepMind إعادة النظر في المآثر التي جعلتها مشهورة: الفوز بألعاب الطاولة.
التلاعب بالنظام
صنعت DeepMind اسمها في الألعاب. في عام 2016، تصدرت الشركة عناوين الأخبار عندما تغلب برنامج الذكاء الاصطناعي على بطل العالم Go ، وهي لعبة لوحة صينية معقدة بشكل شرير.
بعد الانتصار، قامت DeepMind ببناء نظام أكثر عمومية، AlphaZero. باستخدام عملية التجربة والخطأ التي تسمى التعلم المعزز، أتقن البرنامج ليس فقط Go ، ولكن أيضًا الشطرنج والشوغي (المعروف أيضًا باسم “الشطرنج الياباني”).
AlphaDev – منشئ الخوارزمية الجديد – مبني على AlphaZero. لكن تأثير الألعاب يتجاوز النموذج الأساسي.
نحن نعاقبها على ارتكابها أخطاء.
صاغت DeepMind مهمة AlphaDev باعتبارها لعبة لاعب واحد. للفوز باللعبة، كان على النظام إنشاء خوارزمية فرز جديدة ومحسنة.
لعب النظام حركاته عن طريق تحديد تعليمات التجميع لإضافتها إلى الخوارزمية.
للعثور على الإرشادات المثلى، كان على النظام فحص كمية كبيرة من مجموعات التعليمات. وفقًا لـ DeepMind ، كان الرقم مشابهًا لعدد الجسيمات في الكون. وفقط خيار واحد سيء يمكن أن يبطل الخوارزمية بأكملها.
بعد كل خطوة، قارن AlphaDev ناتج الخوارزمية بالنتائج المتوقعة. إذا كانت المخرجات صحيحة وكان الأداء فعالاً، فإن النظام يحصل على “مكافأة” – إشارة إلى أنه كان يلعب بشكل جيد.
قال دانييل مانكوفيتز ، الباحث الرئيسي، لـ TNW: “نحن نعاقبها على ارتكابها أخطاء، ونكافئها على إيجاد المزيد والمزيد من هذه التسلسلات مرتبة بشكل صحيح”.
كما خمنت على الأرجح، فاز AlphaDev باللعبة. لكن النظام لم يجد البرنامج الصحيح والأسرع فقط. كما اكتشف طرقًا جديدة للمهمة.

احتوت الخوارزميات الجديدة على تسلسلات تعليمات حفظت تعليمة واحدة في كل مرة تم تطبيقها. أطلق عليها اسم “تحركات المبادلة والنسخ”، وكانت بمثابة اختصارات لمزيد من الكفاءات الخوارزمية.
يقارن DeepMind النهج بلحظة أخرى في الألعاب: “الحركة 37” الأسطورية ، التي لعبها نظام الذكاء الاصطناعي ضد بطل Go Lee Sedol.
صدمت هذه الخطوة الغريبة الخبراء البشريين، الذين اعتقدوا أن الآلة قد ارتكبت خطأ. لكنهم سرعان ما اكتشفوا أن البرنامج لديه خطة.
قال مانكوفيتز: “انتهى الأمر ليس فقط بالفوز باللعبة، ولكن أيضًا التأثير على الاستراتيجيات التي بدأ لاعبو Go المحترفون في استخدامها”.
يمثل هذا الفوز المرة الأولى التي يتفوق فيها الذكاء الاصطناعي على أفضل محترف Go – وهو معلم توقع الخبراء أنه على بعد عقد آخر.
بعد ثلاث سنوات، تقاعد لي من مسابقة Go الاحترافية. وأرجع القرار إلى قدرات منافسيه في مجال الذكاء الاصطناعي.
قال “حتى لو أصبحت رقم واحد، هناك كيان لا يمكن هزيمته”.
فرز الحوسبة
أصبحت خوارزميات الفرز الخاصة بـ AlphaDev مفتوحة المصدر في مكتبة C ++ الرئيسية، حيث تتوفر لملايين المطورين والشركات. وفقًا لـ DeepMind ، هذا هو أول تغيير لهذا الجزء من مكتبة الفرز منذ أكثر من عقد – وأول خوارزمية مصممة من خلال التعلم المعزز للانضمام إلى المكتبة.
بعد لعبة الفرز، بدأ AlphaDev باللعب مع التجزئة، والتي تُستخدم لاسترداد البيانات وتخزينها وضغطها. وكانت النتيجة خوارزمية محسّنة أخرى، تم إصدارها الآن في مكتبة أبسيل مفتوحة المصدر. يقدر DeepMind أنه يتم استخدامه تريليونات المرات في اليوم.
في النهاية، يتصور المختبر AlphaDev كخطوة نحو تحويل نظام الحوسبة بأكمله. وقد بدأ كل شيء بلعب ألعاب الطاولة.
المصدر: thenextweb
قد يهمك: