Noindex Nofollow و Disallow: توجيهات بحث الزاحف
نشرت: 2022-12-01هناك ثلاثة أوامر (أوامر) يمكنك استخدامها لإملاء كيفية اكتشاف محركات البحث للمعلومات من موقعك وتخزينها وتقديمها كنتائج بحث:
- NoIndex: لا تقم بإضافة صفحتي إلى نتائج البحث.
- NoFollow: لا تنظر إلى الروابط الموجودة على هذه الصفحة.
- عدم السماح: لا تنظر إلى هذه الصفحة على الإطلاق.
تسمح لك هذه التوجيهات بالتحكم في صفحات موقعك التي يمكن لمحركات البحث الزحف إليها والظهور في البحث.
ماذا يعني عدم وجود مؤشر؟
يخبر التوجيه noindex برامج زحف البحث ، مثل googlebot ، بعدم تضمين صفحة ويب في نتائج البحث الخاصة بها.
كيف تضع علامة NoIndex على الصفحة؟
هناك طريقتان لإصدار أمر noindex :
- أضف علامة وصفية noindex إلى شفرة HTML للصفحة
- قم بإرجاع رأس noindex في طلب HTTP
باستخدام العلامة الوصفية "no index" لصفحة ، أو كرأس استجابة HTTP ، فأنت تخفي الصفحة بشكل أساسي من البحث.
يمكن أيضًا استخدام أمر noindex لحظر محركات بحث محددة فقط. على سبيل المثال ، يمكنك منع Google من فهرسة صفحة مع استمرار السماح لـ Bing:
مثال: منع معظم محركات البحث *
<meta name = ”robots” content = ”noindex”>
مثال: حظر جوجل فقط
<meta name = ”googlebot” content = ”noindex”>
يُرجى ملاحظة ما يلي: اعتبارًا من سبتمبر 2019 ، لم تعد Google تحترم توجيهات noindex في ملف robots.txt . يجب إصدار Noindex الآن عبر علامة HTML الوصفية أو رأس استجابة HTTP. بالنسبة إلى المستخدمين الأكثر تقدمًا ، لا يزال خيار عدم السماح صالحًا في الوقت الحالي ، على الرغم من أنه لا ينطبق على جميع حالات الاستخدام.
ما الفرق بين noindex و nofollow؟
إنه فرق بين تخزين المحتوى واكتشاف المحتوى:
يتم تطبيق noindex على مستوى الصفحة ويطلب من زاحف محرك البحث عدم فهرسة صفحة في نتائج البحث وعرضها.
يتم تطبيق nofollow على الصفحة أو مستوى الارتباط ويخبر زاحف محرك البحث بعدم اتباع (اكتشاف) الروابط.
تزيل علامة noindex بشكل أساسي صفحة من فهرس البحث ، وتزيل سمة nofollow ارتباطًا من الرسم البياني لرابط محرك البحث.
NoFollow كسمة صفحة
يعني استخدام nofollow على مستوى الصفحة أن برامج الزحف لن تتبع أيًا من الروابط الموجودة في تلك الصفحة لاكتشاف محتوى إضافي ، ولن تستخدم برامج الزحف الروابط كإشارات ترتيب للمواقع المستهدفة.
<meta name = "robots" content = "nofollow">
NoFollow كسمة ارتباط
يؤدي استخدام nofollow على مستوى الارتباط إلى منع برامج الزحف من استكشاف ارتباط محدد للإعلان ، كما يمنع استخدام هذا الارتباط كإشارة تصنيف.
يتم تطبيق التوجيه nofollow على مستوى الارتباط باستخدام سمة rel داخل علامة href:
<a href="https://domain.com" rel="ofollow @
بالنسبة إلى Google على وجه التحديد ، فإن استخدام سمة الرابط nofollow سيمنع موقعك من تمرير PageRank إلى عناوين URL المقصودة.
لماذا يجب وضع علامة على الصفحة على أنها NoFollow؟
بالنسبة لغالبية حالات الاستخدام ، يجب ألا تضع علامة "nofollow" على صفحة كاملة - ويكفي وضع علامة "nofollow" على الروابط الفردية.
يمكنك وضع علامة " nofollow " على صفحة كاملة إذا لم تكن تريد من Google عرض الروابط على الصفحة ، أو إذا كنت تعتقد أن الروابط الموجودة على الصفحة قد تؤذي موقعك.
في معظم الحالات ، يتم استخدام توجيهات nofollow الشاملة على مستوى الصفحة عندما لا تتحكم في المحتوى الذي يتم نشره على الصفحة قام بعض الناشرين المتميزين أيضًا بتطبيق التوجيه nofollow على صفحاتهم لثني كتّابهم عن وضع روابط إعلانية ضمن المحتوى الخاص بهم.
كيف يمكنني استخدام صفحات NoIndex؟
ضع علامة على الصفحات على أنها noindex التي من غير المحتمل أن تقدم قيمة للمستخدمين ويجب ألا تظهر كنتائج بحث. على سبيل المثال ، من غير المحتمل أن يكون للصفحات الموجودة للصفحات الفاصلة للصفحات نفس المحتوى المعروض عليها بمرور الوقت.
من غير المحتمل أن تعرض Domain.com/category/resultspage=2 للمستخدم نتائج أفضل من domain.com/category/resultspage=1 وستتنافس الصفحتان مع بعضهما البعض فقط في البحث. من الأفضل عدم فهرسة الصفحات التي يكون الغرض الوحيد منها هو ترقيم الصفحات.
فيما يلي أنواع الصفحات التي يجب أن تفكر فيها في noindexing:
- الصفحات المستخدمة لترقيم الصفحات
- صفحات البحث الداخلي
- الصفحات المقصودة المحسّنة للإعلانات
- مثال: يعرض فقط نموذج الملعب والاشتراك ، ولا يوجد تنقل رئيسي
- على سبيل المثال: أشكال مكررة لنفس المحتوى ، تُستخدم فقط للإعلانات
- صفحات المؤلف المؤرشفة
- صفحات في تدفقات الخروج
- صفحات التأكيد
- مثال: صفحات الشكر
- على سبيل المثال: اطلب صفحات كاملة
- مثال: النجاح! الصفحات
- بعض الصفحات التي تم إنشاؤها بواسطة المكون الإضافي والتي لا تكون ذات صلة بموقعك (على سبيل المثال: إذا كنت تستخدم مكونًا إضافيًا للتجارة ولكنك لا تستخدم صفحات المنتج العادية)
- صفحات المسؤول وصفحات تسجيل دخول المسؤول
بمناسبة Noindex صفحة و Nofollow
ستحظر الصفحة التي تم تمييزها بعلامة noindex و nofollow الزاحف من فهرسة تلك الصفحة ، وتمنع الزاحف من استكشاف الروابط الموجودة على الصفحة.
بشكل أساسي ، توضح الصورة أدناه ما سيراه محرك البحث على صفحة الويب اعتمادًا على كيفية استخدامك لتعليمات noindex و nofollow:
وضع علامة على صفحة مفهرسة بالفعل على أنها NoIndex
إذا قام محرك بحث بفهرسة إحدى الصفحات بالفعل ، وقمت بتمييزها على أنها noindex ، فعندئذٍ في المرة التالية التي يتم فيها الزحف إلى الصفحة ، ستتم إزالتها من نتائج البحث لكي تعمل طريقة إزالة الصفحة من الفهرس هذه ، يجب ألا تحظر (تمنع) الزاحف باستخدام ملف robots.txt.
إذا طلبت من الزاحف عدم قراءة الصفحة ، فلن يرى أبدًا علامة noindex ، وستظل الصفحة مفهرسة على الرغم من عدم تحديث محتواها.
كيف يمكنني منع محركات البحث من فهرسة موقعي؟
إذا كنت تريد إزالة صفحة من فهرس البحث ، بعد فهرستها بالفعل ، يمكنك إكمال الخطوات التالية:
- تطبيق أمر noindex أضف سمة noindex إلى العلامة الوصفية أو رأس استجابة HTTP
- اطلب من محرك البحث الزحف إلى الصفحة بالنسبة إلى Google ، يمكنك القيام بذلك في وحدة تحكم البحث ، واطلب من Google إعادة فهرسة الصفحة. سيؤدي هذا إلى قيام Googlebot بالزحف إلى الصفحة ، حيث سيكتشف Googlebot أمر noindex. ستحتاج إلى القيام بذلك لكل محرك بحث تريد إزالة الصفحة.
- تأكد من إزالة الصفحة من البحث بمجرد أن تطلب من الزاحف إعادة زيارة صفحة الويب الخاصة بك ، امنحها بعض الوقت ، ثم تأكد من إزالة صفحتك من نتائج البحث. يمكنك القيام بذلك عن طريق الانتقال إلى أي محرك بحث وإدخال عنوان url الخاص بنقطة الموقع المستهدفة ، كما في الصورة أدناه.
إذا لم يُرجع بحثك أية نتائج ، فهذا يعني أنه قد تمت إزالة صفحتك من فهرس البحث هذا. - إذا لم تتم إزالة الصفحة ، فتحقق من عدم وجود أمر "عدم السماح" في ملف robots.txt الخاص بك. لا يمكن لمحركات البحث Google ومحركات البحث الأخرى قراءة أمر noindex إذا لم يُسمح لهم بالزحف إلى الصفحة ، وإذا قمت بذلك ، فقم بإزالة الأمر disallow للصفحة الهدف ، ثم اطلب الزحف مرة أخرى.
- قم بتعيين أمر عدم السماح للصفحة الهدف في ملف robots.txt الخاص بك Disallow: / page $
ستحتاج إلى وضع علامة الدولار في نهاية عنوان URL في ملف robots.txt الخاص بك أو قد تمنع عرضًا أي صفحات ضمن تلك الصفحة ، بالإضافة إلى أي صفحات تبدأ بالسلسلة نفسها. على سبيل المثال: Disallow: / sweater will also disallow / sweater-weather and / sweater / green ، لكن Disallow: / sweater $ لن يسمح إلا بالصفحة / السترة بالضبط.
كيف لإزالة صفحة من بحث Google
إذا كانت الصفحة التي تريد إزالتها من البحث موجودة على موقع تملكه أو تديره ، فيمكن لمعظم المواقع استخدام أداة إزالة عنوان URL لمشرفي المواقع.
تعمل أداة إزالة عنوان URL لمشرفي المواقع على إزالة المحتوى من البحث لمدة 90 يومًا تقريبًا ، وإذا كنت تريد حلاً دائمًا ، فستحتاج إلى استخدام أمر noindex أو عدم السماح بالزحف من ملف robots.txt أو إزالة الصفحة من موقعك. تقدم Google إرشادات إضافية هنا لإزالة عنوان URL بشكل دائم.
إذا كنت تحاول إزالة صفحة من البحث عن موقع لا تملكه ، فيمكنك مطالبة Google بإزالة الصفحة من البحث إذا كانت تفي بالمعايير التالية:
- يعرض معلومات شخصية مثل بطاقة الائتمان أو رقم الضمان الاجتماعي
- الصفحة جزء من برنامج ضار أو مخطط تصيد
- الصفحة تنتهك القانون
- الصفحة تنتهك حقوق التأليف والنشر
إذا كانت الصفحة لا تفي بأحد المعايير المذكورة أعلاه ، يمكنك الاتصال بشركة تحسين محركات البحث أو شركة العلاقات العامة للمساعدة في إدارة السمعة عبر الإنترنت.
يجب عليك noindex صفحات الفئة؟
لا يُنصح عادةً بصفحات فئة noindex ، إلا إذا كنت مؤسسة على مستوى المؤسسة تقوم بتدوير صفحات الفئات برمجيًا استنادًا إلى عمليات البحث أو العلامات التي ينشئها المستخدم ويصبح المحتوى المكرر غير عملي.
بالنسبة للجزء الأكبر ، إذا كنت تقوم بوضع علامات على المحتوى الخاص بك بذكاء ، بطريقة تساعد المستخدمين على التنقل بشكل أفضل في موقعك والعثور على ما يحتاجون إليه ، فستكون بخير.
في الواقع ، يمكن أن تكون صفحات الفئات بمثابة مناجم ذهبية لكبار المسئولين الاقتصاديين لأنها تظهر عادةً عمق المحتوى ضمن موضوعات الفئة.
ألق نظرة على هذا التحليل الذي أجريناه في ديسمبر 2018 لتحديد قيمة صفحات الفئات لعدد قليل من المنشورات عبر الإنترنت.
لقد وجدنا أن الصفحات المقصودة للفئة مرتبة لمئات الكلمات الرئيسية للصفحة 1 ، وجلبت الآلاف من الزوار العضويين كل شهر.
غالبًا ما تجلب صفحات الفئات الأكثر قيمة لكل موقع الآلاف من الزوار العضويين لكل منها.
ألق نظرة على EW.com أدناه ، وقمنا بقياس حركة المرور إلى كل صفحة (ممثلة بحجم الدائرة) وقيمة حركة المرور إلى كل صفحة (ممثلة بلون الدائرة).
القيمة العضوية الشهرية للصفحة = عمق اللون
تخيل الآن الرسوم البيانية نفسها ، ولكن بالنسبة للمواقع القائمة على المنتجات حيث من المحتمل أن يقوم الزوار بعمليات شراء نشطة.
ومع ذلك ، إذا كانت فئاتك متشابهة بما يكفي لإرباك المستخدم أو التنافس مع بعضها البعض في البحث ، فقد تحتاج إلى إجراء تغيير:
- إذا كنت تقوم بتعيين الفئات بنفسك ، فإننا نوصي بترحيل المحتوى من فئة إلى أخرى وتقليل العدد الإجمالي للفئات لديك بشكل عام.
- إذا كنت تسمح للمستخدمين بتدوير الفئات ، فقد ترغب في عدم فهرسة صفحات الفئات التي أنشأها المستخدم ، على الأقل حتى تخضع الفئات الجديدة لعملية مراجعة.
كيف أمنع Google من فهرسة النطاقات الفرعية؟
هناك بعض الخيارات لمنع Google من فهرسة النطاقات الفرعية:
- يمكنك إضافة كلمة مرور باستخدام ملف .htpasswd
- يمكنك عدم السماح لبرامج الزحف باستخدام ملف robots.txt
- يمكنك إضافة أمر noindex إلى كل صفحة في النطاق الفرعي
- يمكنك 404 جميع صفحات النطاق الفرعي
إضافة كلمة مرور لحظر الفهرسة
إذا كانت نطاقاتك الفرعية لأغراض التطوير ، فإن إضافة ملف .htpasswd إلى الدليل الجذر لنطاقك الفرعي هو الخيار الأمثل. سيمنع جدار تسجيل الدخول برامج الزحف من فهرسة المحتوى على النطاق الفرعي ، كما سيمنع وصول المستخدم غير المصرح به.
أمثلة على حالات الاستخدام:
- Dev.domain.com
- Staging.domain.com
- Testing.domain.com
- QA.domain.com
- UAT.domain.com
استخدام ملف robots.txt لحظر الفهرسة
إذا كانت المجالات الفرعية الخاصة بك تخدم أغراضًا أخرى ، فيمكنك إضافة ملف robots.txt إلى الدليل الجذر لنطاقك الفرعي. يجب أن يكون الوصول إليها كما يلي:
https://subdomain.domain.com/robots.txt
ستحتاج إلى إضافة ملف robots.txt إلى كل مجال فرعي تحاول منعه من البحث. مثال:
https://help.domain.com/robots.txt
https://public.domain.com/robots.txt
في كل حالة يجب أن لا يسمح ملف robots.txt لبرامج الزحف ، ولحظر معظم برامج الزحف بأمر واحد ، استخدم الشفرة التالية:
وكيل المستخدم: *
عدم السماح: /
النجمة * بعد وكيل المستخدم: تسمى حرف البدل ، وسوف تتطابق مع أي تسلسل من الأحرف. سيؤدي استخدام حرف بدل إلى إرسال الأمر disallow التالي إلى جميع وكلاء المستخدم بغض النظر عن أسمائهم ، من googlebot إلى yandex.
تُخبر الشرطة المائلة للخلف الزاحف أن جميع الصفحات خارج النطاق الفرعي مضمنة في الأمر disallow.
كيفية حظر فهرسة صفحات النطاق الفرعي بشكل انتقائي
إذا كنت ترغب في ظهور بعض الصفحات من نطاق فرعي في البحث دون غيرها ، فلديك خياران:
- استخدم توجيهات noindex على مستوى الصفحة
- استخدام مجلد أو توجيهات عدم السماح على مستوى الدليل
ستكون توجيهات noindex على مستوى الصفحة أكثر صعوبة في التنفيذ ، حيث يجب إضافة التوجيه إلى HTML أو رأس كل صفحة. ومع ذلك ، ستمنع توجيهات noindex Google من فهرسة نطاق فرعي سواء تمت فهرسة النطاق الفرعي أم لا.
من الأسهل تنفيذ أوامر عدم السماح على مستوى الدليل ، ولكنها لن تعمل إلا إذا لم تكن صفحات النطاق الفرعي موجودة في فهرس البحث بالفعل. ما عليك سوى تحديث ملف robots.txt للنطاق الفرعي لمنع الزحف إلى الأدلة أو المجلدات الفرعية السارية.
كيف يمكنني معرفة ما إذا كانت صفحاتي غير مفهرسة؟
يمكن أن تؤدي إضافة صفحات توجيه بدون فهرس على موقعك إلى عواقب وخيمة على تصنيفات البحث ورؤية البحث.
إذا وجدت أن إحدى الصفحات لا ترى أي حركة مرور عضوية على الرغم من المحتوى الجيد والروابط الخلفية ، فتحقق أولاً من أنك لم تمنع برامج الزحف عن طريق الخطأ من ملف robots.txt الخاص بك. إذا لم يؤد ذلك إلى حل مشكلتك ، فستحتاج إلى التحقق من الصفحات الفردية بحثًا عن توجيهات noindex.
التحقق من NoIndex على صفحات WordPress
يجعل WordPress من السهل إضافة أو إزالة هذه العلامة على صفحاتك. الخطوة الأولى في التحقق من nofollow على صفحاتك هي ببساطة تبديل إعداد رؤية محرك البحث ضمن علامة التبويب "القراءة" في قائمة "الإعدادات".
من المحتمل أن يؤدي هذا إلى حل المشكلة ، ولكن هذا الإعداد يعمل كـ "اقتراح" وليس قاعدة ، وقد ينتهي الأمر بفهرسة بعض المحتوى الخاص بك على أي حال.
لضمان الخصوصية المطلقة لملفاتك ومحتوياتك ، سيتعين عليك اتخاذ خطوة أخيرة إما باستخدام كلمة مرور لحماية موقعك باستخدام أدوات إدارة cPanel ، إذا كانت متوفرة ، أو من خلال مكون إضافي بسيط.
وبالمثل ، يمكن إزالة هذه العلامة من المحتوى الخاص بك عن طريق إزالة حماية كلمة المرور وإلغاء تحديد إعداد الرؤية.
التحقق من NoIndex على Squarespace
يتم أيضًا فهرسة صفحات Squarespace بسهولة باستخدام إمكانية حقن رمز النظام الأساسي. مثل WordPress ، يمكن بسهولة حظر Squarespace من عمليات البحث الروتينية باستخدام حماية كلمة المرور ، ولكن النظام الأساسي ينصح أيضًا بعدم اتخاذ هذه الخطوة لحماية سلامة المحتوى الخاص بك.
من خلال إضافة سطر كود NoIndex داخل كل صفحة تريد إخفاءها من محركات البحث على الإنترنت وإلى كل صفحة فرعية أسفلها ، يمكنك ضمان سلامة المحتوى الآمن الذي يجب منعه من الوصول العام. مثل الأنظمة الأساسية الأخرى ، فإن إزالة هذه العلامة أمر بسيط أيضًا: ببساطة استخدام ميزة Code Injection لإخراج الشفرة مرة أخرى هو كل ما عليك القيام به.
تعتبر Squarespace فريدة من نوعها من حيث أن منافسيها يقدمون هذا الخيار بشكل أساسي كجزء من مجموعة الإعدادات في أدوات إدارة الصفحة. يغادر Squarespace هنا ، مما يسمح بالتلاعب الشخصي بالشفرة. هذا مثير للاهتمام لأنك قادر على رؤية التغيير الذي تقوم بإجرائه على محتوى صفحتك ، على عكس الآخرين في هذه المساحة.
التحقق من NoIndex على Wix
يسمح Wix أيضًا بإصلاح بسيط وسريع لمشكلات NoIndexing. في إعدادات "القوائم والصفحات" ، يمكنك ببساطة إلغاء تنشيط خيار "إظهار هذه الصفحة في نتائج البحث" إذا كنت تريد NoIndex صفحة واحدة داخل موقعك.
كما هو الحال مع منافسيها ، تقترح Wix أيضًا حماية كلمة المرور لصفحاتك أو الموقع بأكمله لمزيد من الخصوصية. ومع ذلك ، ينحرف Wix عن الآخرين من حيث أن فريق الدعم لا يصف إجراءً موازيًا على كلا الجبهتين من أجل تأمين المحتوى من الزاحف. يقدم Wix ملاحظة خاصة حول الاختلاف بين إخفاء صفحة من قائمتك وإخفائها من معايير البحث.
هذه نصيحة مفيدة بشكل خاص لمنشئي مواقع الويب الأقل خبرة والذين قد لا يفهمون في البداية الاختلاف مع الأخذ في الاعتبار أن الإزالة من قائمة موقعك تجعل الصفحة غير قابلة للوصول من الموقع ، ولكن ليس من خلال مصطلح بحث Google حكيم.