FLAN: تعمل Google Research على تطوير تعلم آلي أفضل

نشرت Google مؤخرًا بحثًا حول تقنية لتدريب نموذج ليكون قادرًا على حل مشاكل معالجة اللغة الطبيعية بطريقة يمكن تطبيقها على مهام متعددة. بدلاً من تدريب نموذج على حل نوع واحد من المشكلات، يعلمه هذا النهج كيفية حل مجموعة واسعة من المشكلات، مما يجعله أكثر كفاءة ويدعم أحدث ما توصلت إليه التقنية.
ما هو Google Flan؟
اسم النموذج الموصوف في ورقة بحث Google هو FLAN، والذي يرمز إلى LAnguage Net (FLAN). إنها تقنية لضبط التعليمات لمعرفة كيفية حل مهام معالجة اللغة الطبيعية بشكل عام.
يوضح بحث FLAN التحسينات في حل مشكلات Zero-shot. التعلم بدون طلقة هو أسلوب تعلم آلي لتعليم الآلة حل مهمة تحتوي على متغيرات لم تكن مرئية من قبل باستخدام ما تعلمته بالفعل.
لا تستخدم Google جميع الأبحاث في الخوارزميات الخاصة بها
بيان Google الرسمي حول الأوراق البحثية هو أنه لمجرد أنها تنشر خوارزمية لا يعني أنها قيد الاستخدام في بحث Google.
لا شيء في ورقة البحث يشير إلى وجوب استخدامها في البحث. لكن ما يجعل هذا البحث مثيرًا للاهتمام هو أنه يطور حالة الفن ويحسن التكنولوجيا الحالية.
قيمة إدراكك للتكنولوجيا
يمكن للأشخاص الذين لا يعرفون كيفية عمل محركات البحث في نهاية المطاف فهمها من حيث مجرد تكهنات.
هذه هي الطريقة التي انتهى بها المطاف بصناعة البحث بأفكار خاطئة مثل “كلمات LSI الأساسية” والاستراتيجيات غير المنطقية مثل محاولة التغلب على المنافسة من خلال إنشاء محتوى أفضل بعشر مرات (أو ببساطة أكبر) من محتوى المنافس، دون أي اعتبار لما يستخدمه المستخدمون قد تحتاج وتتطلب.
اكتب محتوى جذابًا بأسلوبك الفريد
أتمتة إنشاء المحتوى بالكامل؛ الحصول على أفكار محتوى مخصصة؛ وكتابة المقالات وتحسينها ونشرها بنقرة واحدة – باستخدام ContentShake.
إن القيمة في معرفة هذه الخوارزميات والتقنيات هي إدراك المعالم العامة لما يجري في محركات البحث حتى لا يرتكب المرء خطأ التقليل من قدرة محركات البحث.
المشكلة التي يحلها Google FLAN
المشكلة الرئيسية التي تحلها هذه التقنية هي تمكين الآلة من استخدام قدر هائل من المعرفة لحل مهام العالم الحقيقي.
يعلم هذا النهج الآلة كيفية تعميم حل المشكلات من أجل أن تكون قادرة على حل المشكلات غير المرئية.
يقوم بذلك عن طريق تغذية التعليمات لحل مشاكل محددة ثم تعميم هذه التعليمات لحل مشاكل أخرى.
يقول الباحثون:
“النموذج مضبوط بدقة على مجموعات متباينة من التعليمات ويعمم على التعليمات غير المرئية. مع إضافة المزيد من أنواع المهام إلى تحسين أداء نموذج البيانات.
… نظهر أنه من خلال تدريب نموذج على هذه التعليمات، فإنه لا يصبح جيدًا فقط في حل أنواع التعليمات التي شاهدها أثناء التدريب ولكنه يصبح جيدًا في اتباع التعليمات بشكل عام. “
تستشهد الورقة البحثية بتقنية شائعة حالية تسمى “محفز إطلاق النار أو القليل من الطلقة” التي تدرب الآلة على حل مشكلة لغوية معينة وتصف النقص في هذه التقنية.
الرجوع إلى أسلوب دفع التسديدة الصفرية / قليل من التسديدات:
“تصوغ هذه التقنية مهمة بناءً على نص قد يكون نموذج اللغة قد شاهده أثناء التدريب، حيث يقوم نموذج اللغة بعد ذلك بتوليد الإجابة عن طريق إكمال النص.
على سبيل المثال، لتصنيف المشاعر الخاصة بمراجعة الفيلم، قد يتم إعطاء نموذج اللغة الجملة، “مراجعة الفيلم” أفضل RomCom منذ Pretty Woman “هي _” ويطلب منك إكمال الجملة إما بكلمة “إيجابي” أو “سلبي”.”
لاحظ الباحثون أن أسلوب التسديد الصفري يعمل بشكل جيد ولكن يجب قياس الأداء مقابل المهام التي سبق للنموذج رؤيتها من قبل.
يكتب الباحثون:
“… يتطلب هندسة سريعة ودقيقة لتصميم المهام لتبدو مثل البيانات التي شاهدها النموذج أثناء التدريب …”
وهذا النوع من القصور هو ما تحله FLAN. نظرًا لأن تعليمات التدريب معممة، فإن النموذج قادر على حل المزيد من المشكلات بما في ذلك حل المهام التي لم يتم التدريب عليها مسبقًا.
هل يمكن استخدام Google Flan؟
نادرًا ما تناقش Google الأوراق البحثية المحددة وما إذا كان ما تم وصفه قيد الاستخدام أم لا. موقف Google الرسمي من الأوراق البحثية هو أنها تنشر الكثير منها ولا ينتهي بها الأمر بالضرورة في خوارزمية ترتيب البحث.
جوجل بشكل عام غير شفاف بشأن ما هو موجود في خوارزمياتهم وهو محق في ذلك.
حتى عندما تعلن عن تقنيات جديدة تميل Google إلى منحها أسماء لا تتوافق مع الأوراق البحثية المنشورة. على سبيل المثال، أسماء مثل Neural Matching و Rank Brain لا تتوافق مع أوراق بحثية محددة.
من المهم مراجعة نجاح البحث لأن بعض الأبحاث لا تفي بأهدافها ولا تؤدي أداءً جيدًا مثل أحدث التقنيات والخوارزميات.
يمكن تجاهل تلك الأوراق البحثية التي تقصر إلى حد ما ولكن من الجيد معرفة ذلك.
الأوراق البحثية ذات القيمة الأكبر لمجتمع التسويق عبر البحث هي تلك التي تكون ناجحة وتقدم أداءً أفضل بكثير من أحدث ما توصلت إليه التقنية.
وهذا هو الحال مع FLAN من Google.
تعمل FLAN على تحسين الحالة الحالية للفن ولهذا السبب فإن FLAN شيء يجب أن تكون على دراية به.
لاحظ الباحثون:
“قمنا بتقييم FLAN على 25 مهمة ووجدنا أنها تتحسن على جميع المهام باستثناء أربعة. لقد وجدنا أن نتائجنا أفضل من GPT-3 بدون طلقة في 20 من 25 مهمة، وأفضل حتى من عدد قليل من GPT-3 في بعض المهام “.
الاستدلال اللغوي الطبيعي
مهمة الاستدلال اللغوي الطبيعي هي المهمة التي يتعين على الجهاز فيها تحديد ما إذا كانت فرضية معينة صحيحة أو خاطئة أو غير محددة / محايدة (ليست صحيحة أو خاطئة).
أداء الاستدلال اللغوي الطبيعي لـ FLAN
قراءة الفهم
هذه مهمة للإجابة على سؤال بناءً على محتوى في مستند.
أداء الفهم القرائي لـ FLAN
كتاب مغلق لضمان الجودة
هذه هي القدرة على الإجابة عن الأسئلة بالبيانات الواقعية، والتي تختبر القدرة على مطابقة الحقائق المعروفة مع الأسئلة. مثال على ذلك هو الإجابة على أسئلة مثل ما لون السماء أو من كان أول رئيس للولايات المتحدة.
كتاب مغلق QA Performance of FLAN
هل تستخدم Google FLAN؟
كما ذكرنا سابقًا، لا تؤكد Google بشكل عام ما إذا كانت تستخدم خوارزمية أو تقنية معينة.
ومع ذلك، فإن حقيقة أن هذه التقنية المعينة تحرك أحدث ما توصلت إليه التقنية إلى الأمام قد تعني أنه ليس من غير المعقول التكهن بإمكانية دمج شكل ما في خوارزمية Google ، مما يحسن قدرتها على الإجابة على استفسارات البحث.
نُشر هذا البحث في 28 أكتوبر 2021.
هل يمكن دمج بعض من هذا في تحديث الخوارزمية الأساسي الأخير؟
تركز تحديثات الخوارزمية الأساسية بشكل عام على فهم الاستعلامات وصفحات الويب بشكل أفضل وتقديم إجابات أفضل.
يمكن للمرء أن يتكهن فقط لأن Google نادرًا ما تشارك التفاصيل، خاصة فيما يتعلق بتحديثات الخوارزمية الأساسية.
المصدر: searchenginejournal
شاهد ايضا: