Google بشأن حماية إشارة النص الأساسي من تأثير موقع البريد العشوائي

تحافظ Google على جودة إشارة النص الأساسي من خلال تجاهل الروابط من مواقع البريد العشوائي
في جلسة ساعات عمل Google SEO، أجاب Duy Nguyen من فريق جودة البحث من Google على سؤال حول الروابط الموجودة على مواقع البريد العشوائي وكيف ترتبط الثقة بها.
كان من المثير للاهتمام كيف قال موظف Google إنهم يحمون إشارة نص الإرساء. إنه ليس شيئًا يتم مناقشته بشكل شائع.
يُعد بناء الثقة مع Google أحد الاعتبارات المهمة للعديد من الناشرين ومُحسّنات محرّكات البحث.
هناك فكرة مفادها أن “الثقة” ستساعد في فهرسة الموقع وترتيبه بشكل صحيح.
ومن المعروف أيضًا أنه لا يوجد مقياس “ثقة”، مما يؤدي أحيانًا إلى إرباك البعض في مجتمع البحث.
كيف يمكن أن تثق الخوارزمية إذا لم تكن تقيس شيئًا ما؟
لا يجيب موظفو Google حقًا على هذا السؤال ولكن هناك براءات اختراع وأوراق بحثية تعطي فكرة.
لا تثق Google في الروابط الواردة من مواقع البريد العشوائي
سأل الشخص الذي أرسل سؤالاً إلى ساعات عمل كبار المسئولين الاقتصاديين:
“إذا تمت معاقبة النطاق، فهل يؤثر ذلك على الروابط الصادرة منه؟”
أجاب دوي نغوين ، موظف Google:
“أفترض من خلال” معاقبة “أنك تعني أنه تم تخفيض ترتيب النطاق من خلال خوارزميات الرسائل غير المرغوب فيها أو الإجراءات اليدوية.
بشكل عام، نعم، لا نثق في الروابط الواردة من المواقع التي نعلم أنها رسائل غير مرغوب فيها.
يساعدنا هذا في الحفاظ على جودة إشارات الإرساء “.
الثقة والروابط
يتحدث موظفو Google عن الثقة ومن الواضح أنهم يتحدثون عن ثقة خوارزمياتهم بشيء ما أو عدم ثقتهم بشيء ما.
في هذه الحالة، لا يتعلق الأمر بعدم حساب الروابط الموجودة على مواقع البريد العشوائي، على وجه الخصوص، يتعلق الأمر بعدم حساب إشارة نص الرابط.
يتحدث مجتمع مُحسّنات محرّكات البحث عن “بناء الثقة” ولكن في هذه الحالة، يتعلق الأمر حقًا بعدم إنشاء رسائل غير مرغوب فيها.
كيف تحدد Google أن موقعًا ما هو بريد عشوائي؟
لا يتم معاقبة كل موقع أو يتلقى إجراء يدويًا. لم تتم فهرسة بعض المواقع، وهذه هي مهمة Spam Brain من Google ، وهي منصة AI تحلل صفحات الويب في نقاط مختلفة، بدءًا من وقت الزحف.
تعمل منصة الدماغ البريد العشوائي على النحو التالي:
- تحظر الفهرسة Gatekeeper
Spam Brain المواقع في وقت الزحف، بما في ذلك المحتوى الذي تم اكتشافه من خلال وحدة تحكم البحث وخرائط المواقع. - يصطاد دماغ البريد العشوائي
المفهرس أيضًا البريد العشوائي الذي تمت فهرسته في النقطة التي يتم فيها النظر في تصنيف المواقع.
الطريقة التي تعمل بها منصة Spam Brain هي أنها تدرب الذكاء الاصطناعي على المعرفة التي تمتلكها Google بشأن البريد العشوائي.
علق Google على كيفية عمل الدماغ غير المرغوب فيه:
“من خلال الجمع بين معرفتنا العميقة بالبريد العشوائي والذكاء الاصطناعي، تمكنا في العام الماضي من بناء ذكاء اصطناعي خاص بنا لمكافحة البريد العشوائي فعال بشكل لا يصدق في اكتشاف اتجاهات البريد العشوائي المعروفة والجديدة.”
لا نعرف ما الذي تتحدث عنه Google ” المعرفة بالبريد العشوائي “، ولكن هناك العديد من براءات الاختراع والأوراق البحثية حول هذا الموضوع.
أولئك الذين يرغبون في التعمق في هذا الموضوع قد يفكرون في قراءة مقال كتبته حول مفهوم خوارزميات الترتيب عن بعد للرابط، وهي طريقة لترتيب الروابط.
قمت أيضًا بنشر مقال شامل حول العديد من الأوراق البحثية التي تصف الخوارزميات ذات الصلة بالرابط والتي قد تصف ماهية خوارزمية Penguin .
على الرغم من أن العديد من براءات الاختراع والأوراق البحثية كانت خلال السنوات العشر الماضية أو نحو ذلك، لم يتم نشر أي شيء آخر من قبل محركات البحث والباحثين الجامعيين منذ ذلك الحين.
تكمن أهمية براءات الاختراع والأوراق البحثية هذه في أنه من الممكن أن يتم تحويلها إلى خوارزمية Google بشكل مختلف، مثل التدريب والذكاء الاصطناعي مثل Spam Brain.
توضح براءة الاختراع التي تمت مناقشتها في مقالة ترتيب مسافة الارتباط كيفية قيام الطريقة بتعيين درجات التصنيف للصفحات بناءً على المسافات بين مجموعة “مواقع الويب الأولية” الموثوقة والصفحات التي ترتبط بها. تعتبر المواقع الأولية بمثابة نقاط بداية لحساب ما هي المواقع العادية والمواقع التي ليست كذلك (أي البريد العشوائي).
الحدس هو أنه كلما كان الموقع بعيدًا عن موقع البذور، من المحتمل أن يُعتبر الموقع غير مرغوب فيه. تمت مناقشة هذا الجزء، حول تحديد البريد العشوائي من خلال مسافة الارتباط، في الأوراق البحثية المذكورة في مقالة Penguin التي أشرت إليها سابقًا.
توضح براءة الاختراع (إنشاء تصنيف للصفحات باستخدام المسافات في رسم بياني لرابط الويب) ما يلي:
“يقوم النظام بعد ذلك بتعيين أطوال الروابط بناءً على خصائص الروابط وخصائص الصفحات المرفقة بالروابط.
يحسب النظام بعد ذلك أقصر المسافات من مجموعة الصفحات الأولية إلى كل صفحة في مجموعة الصفحات بناءً على أطوال الروابط بين الصفحات.
بعد ذلك، يحدد النظام درجة الترتيب لكل صفحة في مجموعة الصفحات بناءً على أقصر المسافات المحسوبة “.
رسم ارتباط مخفض
تذكر براءة الاختراع نفسها أيضًا ما يُعرف باسم الرسم البياني للارتباط المختزل.
لكنها ليست مجرد براءة اختراع واحدة تناقش الرسوم البيانية المختصرة للوصلة. تم البحث عن الرسوم البيانية للارتباط المخفّضة خارج Google أيضًا.
الرسم البياني للارتباط يشبه خريطة الإنترنت التي يتم إنشاؤها عن طريق التعيين باستخدام الارتباطات.
في الرسم البياني للارتباط المنخفض، تتم إزالة الروابط منخفضة الجودة والمواقع المرتبطة.
ما تبقى هو ما يسمى الرسم البياني للارتباط المختزل.
إليك اقتباس من براءة اختراع Google المذكورة أعلاه:
“ارتباط رسم بياني مخفض
لاحظ أن الروابط المشاركة في أقصر مسارات k من البذور إلى الصفحات تشكل رسمًا بيانيًا فرعيًا يتضمن جميع الروابط “التدفق” مرتبة من البذور.
على الرغم من أن هذا الرسم البياني الفرعي يشتمل على روابط أقل بكثير من الرسم البياني الأصلي للارتباط، فإن أقصر مسارات k من البداية إلى كل صفحة في هذا الرسم البياني الفرعي لها نفس أطوال المسارات في الرسم البياني الأصلي.
… علاوة على ذلك، يمكن إرجاع تدفق الترتيب لكل صفحة إلى أقرب k بذور عبر المسارات في هذا الرسم البياني الفرعي “.
لا تثق Google في الروابط من المواقع المعاقب عليها
إنه نوع من الأشياء الواضحة أن Google لا تثق في الروابط من مواقع الويب المعاقب عليها.
لكن في بعض الأحيان لا يعرف المرء ما إذا كان موقع ما قد تم معاقبة أو وضع علامة على أنه محتوى غير مرغوب فيه من قبل Spam Brain.
يعد البحث لمعرفة ما إذا كان موقع ما غير موثوق به فكرة جيدة قبل متابعة جهود محاولة الحصول على رابط من موقع ما.
في رأيي، لا ينبغي استخدام مقاييس الطرف الثالث لاتخاذ قرارات تجارية مثل هذه لأن الحسابات المستخدمة لإنتاج النتيجة مخفية.
إذا كان أحد المواقع يرتبط بالفعل بمواقع ربما تكون غير مرغوب فيها والتي لديها روابط واردة من روابط مدفوعة محتملة مثل PBNs (شبكات المدونات الخاصة)، فمن المحتمل أن يكون موقعًا غير مرغوب فيه.
المصدر: searchenginejournal
أقرا أيضا: