Causal Sim: أداة MIT الجديدة لمحاكاة الأنظمة المعقدة بدقة

تقضي تقنية جديدة على مصدر التحيز في طريقة محاكاة شائعة، والتي يمكن أن تمكن العلماء من إنشاء خوارزميات جديدة أكثر دقة وتعزز أداء التطبيقات والشبكات. الائتمان: جوزيه لويس أوليفاريس / معهد ماساتشوستس للتكنولوجيا
يزيل النظام الذي طوروه مصدر التحيز في عمليات المحاكاة، مما يؤدي إلى تحسين الخوارزميات التي يمكن أن تعزز أداء التطبيقات.
طور باحثو معهد ماساتشوستس للتكنولوجيا Causal Sim ، وهي طريقة للتعلم الآلي تزيل التحيز في عمليات المحاكاة التي تعتمد على التتبع المستخدمة في تصميم الخوارزمية.
تستخدم التقنية مبادئ السببية لفهم كيفية تأثير سلوك النظام على تتبع البيانات، مما يؤدي إلى تنبؤات أكثر دقة لأداء الخوارزمية. تم اختباره في تطبيقات دفق الفيديو، حيث تفوق على المحاكيات التقليدية في التنبؤ بأكثر خوارزمية معدل البت التكيفي كفاءة.
غالبًا ما يستخدم الباحثون عمليات المحاكاة عند تصميم خوارزميات جديدة، نظرًا لأن اختبار الأفكار في العالم الحقيقي يمكن أن يكون مكلفًا ومحفوفًا بالمخاطر.
ولكن نظرًا لأنه من المستحيل التقاط كل تفاصيل نظام معقد في المحاكاة، فإنهم عادةً ما يجمعون كمية صغيرة من البيانات الحقيقية التي يعيدون تشغيلها أثناء محاكاة المكونات التي يريدون دراستها.
تُعرف هذه الطريقة بالمحاكاة التي تعتمد على التتبع (تسمى الأجزاء الصغيرة من البيانات الحقيقية بالتتبع)، تؤدي هذه الطريقة أحيانًا إلى نتائج متحيزة.
هذا يعني أن الباحثين قد يختارون دون قصد خوارزمية ليست الأفضل التي قاموا بتقييمها، والتي ستؤدي بشكل أسوأ على البيانات الحقيقية مما توقعته المحاكاة.
طور باحثو معهد ماساتشوستس للتكنولوجيا طريقة جديدة تقضي على مصدر التحيز في المحاكاة التي تعتمد على التتبع.
من خلال تمكين عمليات المحاكاة غير المتحيزة التي تعتمد على التتبع، يمكن أن تساعد التقنية الجديدة الباحثين على تصميم خوارزميات أفضل لمجموعة متنوعة من التطبيقات، بما في ذلك تحسين جودة الفيديو على الإنترنت وزيادة أداء أنظمة معالجة البيانات.
تعتمد خوارزمية التعلم الآلي للباحثين على مبادئ السببية لمعرفة كيفية تأثر تتبع البيانات بسلوك النظام. وبهذه الطريقة، يمكنهم إعادة تشغيل الإصدار الصحيح وغير المتحيز من التتبع أثناء المحاكاة.
عند مقارنتها بجهاز محاكاة تم تطويره مسبقًا يعتمد على التتبع، تنبأت طريقة محاكاة الباحثين بشكل صحيح بالخوارزمية المصممة حديثًا التي ستكون الأفضل لدفق الفيديو – بمعنى تلك التي أدت إلى تقليل إعادة التخزين المؤقت وجودة بصرية أعلى.
كانت أجهزة المحاكاة الحالية التي لا تأخذ في الحسبان التحيز قد توجه الباحثين إلى خوارزمية ذات أداء أسوأ.
“البيانات ليست الشيء الوحيد المهم. القصة وراء كيفية إنشاء البيانات وجمعها مهمة أيضًا. إذا كنت تريد الإجابة على سؤال غير واقعي، فأنت بحاجة إلى معرفة قصة إنشاء البيانات الأساسية حتى تتدخل فقط في تلك الأشياء التي تريد محاكاتها حقًا “، كما يقول أراش نصر أصفهاني، طالب دراسات عليا في الهندسة الكهربائية وعلوم الكمبيوتر (EECS) وشارك في تأليف ورقة بحثية عن هذه التقنية الجديدة.
انضم إليه في الورقة مؤلفون مشاركون وزملاؤه من طلاب الدراسات العليا في EECS عبد الله العمر وبويا همدانيان؛ طالب دراسات عليا حديثًا أنيش أغاروال دكتوراه في عام 21؛ وكبار المؤلفين محمد علي زاده، الأستاذ المشارك في الهندسة الكهربائية وعلوم الكمبيوتر.
وديفافرات شاه، أستاذ Andrew and Erna Viterbi في EECS وعضو في معهد البيانات والأنظمة والمجتمع ومختبر نظم المعلومات واتخاذ القرار. تم تقديم البحث مؤخرًا في ندوة USENIX حول تصميم وتنفيذ الأنظمة الشبكية.
المحاكاة الخادعة
درس باحثو معهد ماساتشوستس للتكنولوجيا المحاكاة التي تعتمد على التتبع في سياق تطبيقات دفق الفيديو.
في دفق الفيديو، تحدد خوارزمية معدل البت التكيفي باستمرار جودة الفيديو، أو معدل البت، لنقلها إلى جهاز بناءً على بيانات الوقت الفعلي على النطاق الترددي للمستخدم.
لاختبار مدى تأثير خوارزميات معدل البت التكيفية المختلفة على أداء الشبكة، يمكن للباحثين جمع بيانات حقيقية من المستخدمين أثناء دفق فيديو لمحاكاة تعتمد على التتبع.
يستخدمون هذه الآثار لمحاكاة ما كان سيحدث لأداء الشبكة لو استخدمت المنصة خوارزمية مختلفة لمعدل البت التكيفي في نفس الظروف الأساسية.
افترض الباحثون تقليديًا أن بيانات التتبع خارجية، مما يعني أنها لا تتأثر بالعوامل التي يتم تغييرها أثناء المحاكاة.
قد يفترضون أنه خلال الفترة التي قاموا فيها بجمع بيانات أداء الشبكة، فإن الخيارات التي اتخذتها خوارزمية التكيف مع معدل البت لم تؤثر على تلك البيانات.
يوضح علي زاده أن هذا غالبًا ما يكون افتراضًا خاطئًا ينتج عنه تحيزات حول سلوك الخوارزميات الجديدة، مما يجعل المحاكاة غير صالحة.
“لقد أدركنا، واعترفنا الآخرون، أن طريقة المحاكاة هذه يمكن أن تؤدي إلى حدوث أخطاء. لكنني لا أعتقد أن الناس يعرفون بالضرورة مدى أهمية هذه الأخطاء “، كما يقول.
لتطوير حل، صاغ علي زاده ومعاونوه القضية كمشكلة استدلال سببي. لجمع تتبع غير متحيز، يجب على المرء أن يفهم الأسباب المختلفة التي تؤثر على البيانات المرصودة.
بعض الأسباب متأصلة في النظام، بينما يتأثر البعض الآخر بالإجراءات التي يتم اتخاذها.
في مثال دفق الفيديو، يتأثر أداء الشبكة بالخيارات التي اتخذتها خوارزمية تكييف معدل البت – ولكنه يتأثر أيضًا بالعناصر الجوهرية، مثل سعة الشبكة.
“مهمتنا هي فصل هذين التأثيرين، لمحاولة فهم جوانب السلوك التي نراها جوهرية في النظام ومقدار ما نلاحظه يعتمد على الإجراءات التي تم اتخاذها.
إذا تمكنا من فصل هذين التأثيرين، فيمكننا إجراء عمليات محاكاة غير منحازة، “كما يقول.
التعلم من البيانات
لكن الباحثين في كثير من الأحيان لا يستطيعون ملاحظة الخصائص الجوهرية بشكل مباشر. هذا هو المكان الذي تأتي فيه الأداة الجديدة، المسماة Causal Sim. يمكن للخوارزمية معرفة الخصائص الأساسية للنظام باستخدام بيانات التتبع فقط.
يأخذ Causal Sim بيانات التتبع التي تم جمعها من خلال تجربة تحكم عشوائية، ويقدر الوظائف الأساسية التي أنتجت هذه البيانات.
يخبر النموذج الباحثين، في ظل نفس الظروف الأساسية التي اختبرها المستخدم بالضبط، كيف يمكن لخوارزمية جديدة أن تغير النتيجة.
باستخدام جهاز محاكاة نموذجي يعتمد على التتبع، قد يقود التحيز الباحث إلى اختيار خوارزمية ذات أداء أسوأ، على الرغم من أن المحاكاة تشير إلى أنها يجب أن تكون أفضل.
يساعد Causal Sim الباحثين في اختيار أفضل الخوارزمية التي تم اختبارها.
لاحظ باحثو معهد ماساتشوستس للتكنولوجيا هذا في الممارسة. عندما استخدموا Causal Sim لتصميم خوارزمية محسنة لتكييف معدل البت، قادهم ذلك إلى اختيار متغير جديد له معدل توقف أقل بنحو 1.4 مرة من خوارزمية منافسة مقبولة جيدًا، مع تحقيق نفس جودة الفيديو.
معدل التوقف هو مقدار الوقت الذي يقضيه المستخدم في رفض حظر الفيديو.
على النقيض من ذلك، تنبأ جهاز محاكاة مصمم من قبل خبير بعكس ذلك. وأشار إلى أن هذا البديل الجديد يجب أن يتسبب في معدل توقف كان أعلى بنحو 1.3 مرة. اختبر الباحثون الخوارزمية على دفق الفيديو في العالم الحقيقي وأكدوا أن Causal Sim كان صحيحًا.
“كانت المكاسب التي كنا نحققها في المتغير الجديد قريبة جدًا من تنبؤات Causal Sim ، بينما كان المحاكي الخبير بعيد المنال.
هذا مثير حقًا لأن هذا المحاكي المصمم من قبل الخبراء قد تم استخدامه في البحث على مدار العقد الماضي. إذا كان من الواضح أن Causal Sim يمكن أن يكون أفضل من هذا، فمن يدري ماذا يمكننا أن نفعل به؟ ” يقول همدانيان.
خلال تجربة استمرت 10 أشهر، عملت Causal Sim باستمرار على تحسين دقة المحاكاة، مما أدى إلى الخوارزميات التي ارتكبت حوالي نصف عدد الأخطاء التي تم تصميمها باستخدام طرق أساسية.
في المستقبل، يريد الباحثون تطبيق Causal Sim على المواقف التي لا تتوفر فيها بيانات تجربة تحكم عشوائية أو حيث يكون من الصعب بشكل خاص استعادة الديناميكيات السببية للنظام.
يريدون أيضًا استكشاف كيفية تصميم الأنظمة ومراقبتها لجعلها أكثر قابلية للتحليل السببي.
المصدر: scitechdaily
شاهد المزيد: