ما هي الصفقة مع تسرب بيانات عوامل تصنيف Yandex

ما هي الصفقة مع تسرب بيانات عوامل تصنيف Yandex؟ تعرف على المزيد حول ما يعنيه ذلك بالنسبة لعوامل الترتيب وكيفية عمل محركات البحث.
يحاول مجتمع التسويق عبر محركات البحث فهم مستودع Yandex الذي تم تسريبه والذي يحتوي على ملفات تسرد ما يشبه عوامل ترتيب البحث.
قد يبحث البعض عن أدلة عملية لتحسين محركات البحث {سيو} ولكن ربما لا تكون هذه هي القيمة الحقيقية.
الاتفاق العام هو أنه سيكون مفيدًا في اكتساب فهم عام لكيفية عمل محركات البحث.
هناك الكثير لنتعلمه
يعتقد Ryan Jones ( RyanJones ) أن هذا التسريب يمثل مشكلة كبيرة.
لقد قام بالفعل بتحميل بعض نماذج التعلم الآلي من Yandex على أجهزته الخاصة للاختبار.
رايان مقتنع بأن هناك الكثير لنتعلمه ولكن الأمر سيستغرق أكثر بكثير من مجرد فحص قائمة عوامل الترتيب.
يشرح رايان:
“على الرغم من أن Yandex ليست Google ، فهناك الكثير الذي يمكننا تعلمه من هذا من حيث التشابه.
يستخدم Yandex الكثير من التقنيات التي اخترعتها Google. يشيرون إلى PageRank بالاسم، ويستخدمون Map Reduce وBERT والعديد من الأشياء الأخرى أيضًا.
من الواضح أن العوامل ستختلف وستختلف الأوزان المطبقة عليها أيضًا، لكن أساليب علوم الكمبيوتر الخاصة بكيفية تحليل صلة النص ونص الارتباط وإجراء العمليات الحسابية ستكون متشابهة جدًا عبر محركات البحث.
أعتقد أنه يمكننا استخلاص الكثير من الأفكار من عوامل الترتيب، لكن مجرد النظر إلى القائمة المسربة وحدها لا يكفي.
عندما تنظر إلى الأوزان الافتراضية المطبقة (قبل ML)، هناك أوزان سلبية تفترضها مُحسنات محركات البحث إيجابية أو العكس.
هناك أيضًا الكثير من عوامل الترتيب المحسوبة في الكود أكثر مما تم إدراجه في قوائم عوامل الترتيب العائمة.
يبدو أن هذه القائمة هي مجرد عوامل ثابتة ولا تأخذ في الاعتبار كيفية حساب مدى صلة الاستعلام أو العديد من العوامل الديناميكية التي تتعلق بمجموعة النتائج لهذا الاستعلام “.
أكثر من 200 عامل ترتيب
يتكرر بشكل شائع، بناءً على التسرب، أن Yandex يستخدم 1923 عامل ترتيب (يقول البعض أقل).
يقول كريستوف سيمبر (ملف تعريف LinkedIn ) ، مؤسس Link Research Tools ، إن الأصدقاء أخبروه أن هناك العديد من عوامل التصنيف.
شارك كريستوف:
“شاهد الأصدقاء:
- 275 عامل تخصيص
- 220 عامل “حداثة الويب”
- 3186 عوامل البحث عن الصور
- 2314 عوامل البحث عن الفيديو
هناك الكثير مما يمكن تخطيطه.
ربما كان الأمر الأكثر إثارة للدهشة بالنسبة للكثيرين هو أن لدى Yandex مئات العوامل للروابط “.
النقطة المهمة هي أنه أكثر بكثير من 200+ عامل تصنيف استخدمته Google في المطالبة.
وحتى جون مولر من Google قال إن Google ابتعدت عن أكثر من 200 عامل تصنيف.
لذلك ربما يساعد ذلك صناعة البحث على الابتعاد عن التفكير في خوارزمية Google بهذه المصطلحات.
لا أحد يعرف خوارزمية Google بأكملها؟
اللافت في تسرب البيانات هو أن عوامل الترتيب تم جمعها وتنظيمها بهذه الطريقة البسيطة.
يدعو التسرب إلى التساؤل حول فكرة أن خوارزمية Google تخضع لحراسة مشددة وأنه لا أحد، حتى في Google ، يعرف الخوارزمية بأكملها.
هل من الممكن أن يكون هناك جدول بيانات في Google يحتوي على أكثر من ألف عامل ترتيب؟
يتساءل كريستوف سيمبر عن فكرة أن لا أحد يعرف خوارزمية Google.
علق كريستوف على مجلة محرك البحث:
“قال أحدهم على LinkedIn إنه لا يستطيع تخيل” توثيق “عوامل التصنيف من Google تمامًا مثل هذا.
لكن هذه هي الطريقة التي يجب بناء نظام معقد كهذا. هذا التسريب من شخص داخلي موثوق للغاية.
لدى Google رمز يمكن تسريبه أيضًا.
التصريح الذي يتكرر في كثير من الأحيان بأنه لا يعرف حتى موظفي Google عوامل التصنيف بدت دائمًا سخيفة بالنسبة لشخص تقني مثلي.
سيكون عدد الأشخاص الذين لديهم كل التفاصيل صغيرًا جدًا.
ولكن يجب أن يكون موجودًا في الشفرة، لأن الكود هو ما يقوم بتشغيل محرك البحث “.
أي أجزاء من Yandex تشبه Google؟
تُلقي ملفات Yandex المسربة لمحة عن كيفية عمل محركات البحث.
لا تظهر البيانات كيفية عمل Google. ولكنه يوفر فرصة لعرض جزء من كيفية ترتيب محرك البحث (Yandex) لنتائج البحث.
لا ينبغي الخلط بين ما هو موجود في البيانات وما قد تستخدمه Google.
ومع ذلك، هناك أوجه تشابه مثيرة للاهتمام بين محركي البحث.
MatrixNet ليست RankBrain
إحدى الأفكار المثيرة للاهتمام التي يبحث عنها البعض تتعلق بشبكة Yandex العصبية المسماة MatrixNet.
MatrixNet هي تقنية قديمة تم تقديمها في عام 2009 (رابط archive.org للإعلان).
على عكس ما يدعي البعض، فإن MatrixNet ليست نسخة Yandex من RankBrain من Google.
Google RankBrain عبارة عن خوارزمية محدودة تركز على فهم 15٪ من استعلامات البحث التي لم ترها Google من قبل.
كشفت مقالة في بلومبرج عن RankBrain في عام 2015. تنص المقالة على أنه تمت إضافة RankBrain إلى خوارزمية Google في ذلك العام، بعد ست سنوات من تقديم Yandex MatrixNet (لقطة Archive.org للمقال).
تصف مقالة بلومبرج الغرض المحدود من RankBrain:
“إذا رأى RankBrain كلمة أو عبارة ليست مألوفة لها، فيمكن للآلة أن تخمن ما هي الكلمات أو العبارات التي قد يكون لها نفس المعنى وتصفية النتيجة وفقًا لذلك، مما يجعلها أكثر فاعلية في التعامل مع بحث لم يسبق له مثيل استفسارات “.
من ناحية أخرى، فإن MatrixNet عبارة عن خوارزمية للتعلم الآلي تقوم بالكثير من الأشياء.
أحد الأشياء التي يقوم بها هو تصنيف استعلام بحث ثم تطبيق خوارزميات الترتيب المناسبة على هذا الاستعلام.
هذا جزء مما ينص عليه إعلان اللغة الإنجليزية لعام 2016 لخوارزمية 2009:
تتيح MatrixNet إنشاء صيغة تصنيف طويلة جدًا ومعقدة، والتي تأخذ في الاعتبار العديد من العوامل المختلفة ومجموعاتها.
ميزة أخرى مهمة لـ MatrixNet هي أنها تسمح بتخصيص صيغة ترتيب لفئة معينة من استعلامات البحث.
بالمناسبة، لن يؤدي تعديل خوارزمية الترتيب لعمليات البحث عن الموسيقى، على سبيل المثال، إلى تقويض جودة التصنيف لأنواع الاستعلامات الأخرى.
تشبه خوارزمية الترتيب الآلات المعقدة التي تحتوي على عشرات الأزرار والمفاتيح والرافعات والمقاييس. بشكل عام، سيؤدي أي دوران منفرد لأي مفتاح واحد في آلية إلى تغيير شامل في الجهاز بأكمله.
ومع ذلك، تسمح MatrixNet بضبط معلمات محددة لفئات معينة من الاستعلامات دون التسبب في إصلاح شامل للنظام بأكمله.
بالإضافة إلى ذلك، يمكن لـ MatrixNet اختيار الحساسية تلقائيًا لنطاقات محددة من عوامل الترتيب “.
تقوم MatrixNet بأكثر بكثير من RankBrain ، ومن الواضح أنها ليست هي نفسها.
ولكن الشيء الرائع في MatrixNet هو كيف تكون عوامل الترتيب ديناميكية من حيث أنها تصنف استعلامات البحث وتطبق عوامل مختلفة عليها.
تمت الإشارة إلى MatrixNet في بعض مستندات عامل التصنيف، لذلك من المهم وضع MatrixNet في السياق الصحيح بحيث يتم عرض عوامل الترتيب في الضوء الصحيح وجعلها أكثر منطقية.
قد يكون من المفيد قراءة المزيد عن خوارزمية Yandex للمساعدة في فهم تسرب Yandex.
تتطابق بعض عوامل Yandex مع ممارسات تحسين محركات البحث
دومينيك وودمان ( dom_woodman ) لديه بعض الملاحظات المثيرة للاهتمام حول التسريب.
تتطابق بعض عوامل الترتيب التي تم تسريبها مع بعض ممارسات تحسين محركات البحث مثل تغيير نص الرابط:
نشر Alex Buraks ( alex_buraks ) موضوعًا ضخمًا على Twitter حول الموضوع الذي يحتوي على أصداء لممارسات تحسين محركات البحث (SEO).
يتعلق أحد هذه العوامل التي يبرزها Alex بتحسين الروابط الداخلية لتقليل عمق الزحف إلى الصفحات المهمة.
لطالما شجع جون مولر من Google الناشرين على التأكد من ارتباط الصفحات المهمة بشكل بارز.
لا يشجع مولر على دفن الصفحات المهمة في عمق بنية الموقع.
شارك جون مولر في عام 2020:
“إذن ما سيحدث هو أننا سنرى أن الصفحة الرئيسية مهمة حقًا، والأشياء المرتبطة من الصفحة الرئيسية بشكل عام مهمة جدًا أيضًا.
وبعد ذلك … أثناء ابتعاده عن الصفحة الرئيسية، نعتقد أن هذا ربما يكون أقل أهمية “.
من المهم إبقاء الصفحات المهمة قريبة من الصفحات الرئيسية التي يدخل إليها زوار الموقع.
لذلك إذا كانت الروابط تشير إلى الصفحة الرئيسية، فسيتم اعتبار الصفحات المرتبطة من الصفحة الرئيسية أكثر أهمية.
لم يقل جون مولر أن عمق الزحف هو عامل ترتيب. لقد قال ببساطة إنه يشير إلى Google عن الصفحات المهمة.
تستخدم قاعدة Yandex التي استشهد بها Alex عمق الزحف من الصفحة الرئيسية كقاعدة ترتيب.
من المنطقي اعتبار الصفحة الرئيسية نقطة البداية ذات الأهمية ثم حساب أهمية أقل كلما نقر المرء بعيدًا عنها في عمق الموقع.
هناك أيضًا أوراق بحثية من Google لها أفكار مماثلة ( Reasonable Surfer Model ، و Random Surfer Model)، والتي حسبت احتمال أن ينتهي الأمر بمتصفح عشوائي في صفحة ويب معينة ببساطة عن طريق اتباع الروابط.
وجد أليكس عاملاً يعطي الأولوية للصفحات الرئيسية المهمة:
لطالما كانت القاعدة الأساسية لتحسين محركات البحث هي الاحتفاظ بالمحتوى المهم ليس أكثر من بضع نقرات بعيدًا عن الصفحة الرئيسية (أو من الصفحات الداخلية التي تجذب الروابط الواردة).
Yandex Update Vega … متعلق بالخبرة والسلطة؟
قامت Yandex بتحديث محرك البحث الخاص بها في عام 2019 بتحديث باسم Vega.
أظهر تحديث Yandex Vega شبكات عصبية تم تدريبها مع خبراء في الموضوع.
كان الهدف من تحديث 2019 هو تقديم نتائج البحث بصفحات الخبراء والموثوقة.
لكن مسوقي البحث الذين يدققون في المستندات لم يعثروا بعد على أي شيء مرتبط بأشياء مثل السير الذاتية للمؤلف، والتي يعتقد البعض أنها مرتبطة بالخبرة والصلاحية التي تبحث عنها Google.
تعلم، تعلم، تعلم
نحن في الأيام الأولى للتسرب وأعتقد أنه سيؤدي إلى فهم أكبر لكيفية عمل محركات البحث بشكل عام.
المصدر: searchenginejournal
أقرأ ايضا: