Paginierung – ein entscheidendes Element der Suchmaschinenindizierung

Veröffentlicht: 2017-11-08

Inhaltsverzeichnis

SEO-Richtlinien zur Paginierung, zB von Online-Shop-Kategorien oder Blog-Artikeln, sind ein wiederkehrendes Thema und es gibt einige Ansätze dazu. Wir werden diskutieren, wie man die Paginierung angeht, damit Webcrawler Inhalte einfacher verarbeiten können.

Was ist Paginierung?

Bei der Paginierung wird einfach eine bestimmte Ressource auf einer Website in Seiten unterteilt. Das einfachste Beispiel können Kategorien in den meisten Online-Shops sein, in denen der Benutzer nach dem Auflisten einer bestimmten Anzahl von Produkten zum nächsten Teil der Produktliste wechseln kann. Eine weitere Möglichkeit, Produkte innerhalb einer Kategorie zu präsentieren, ist die unendliche Scroll-Paginierung, bei der, wenn der Benutzer nach unten scrollt, neue und neue Produkte angezeigt werden. Dasselbe gilt für Blogs. Im Allgemeinen ist es egal, welche Ressource einer Website in Teile unterteilt wird, es geht vielmehr darum , wie Sie es tun und wie Sie den Googlebot über die folgenden Inhalte informieren.

Lassen Sie Webcrawler tun, was sie tun

Einer der grundlegenden Fehler, der beim Paginieren begangen wird, ist die Verwendung von Canonical-Tags auf der ersten Paginierungsseite. Und obwohl es in einer Situation gerechtfertigt ist, wird es meistens falsch gemacht.

Wenn beispielsweise eine Produktkategorie in einige Seiten unterteilt ist, bedeutet dies, dass die Basisseite eine bestimmte Anzahl von Produkten enthält, die zweite Seite eine andere Gruppe von Produkten usw. bis zur letzten Paginierungsseite.

Paginierungsseiten sind wie folgt:

https://website.com/product-category/page-2
https://website.com/product-category/page-3
https://website.com/product-category/page-4

usw.

Daher macht es wenig Sinn, solche kanonischen Links zu verwenden:

 <link rel="canonical" href="https://website.com/product-category" />

Da es sich um einen weiteren Teil der Produkte aus einer bestimmten Kategorie handelt, sind die Seiten 2,3,4 usw. keine Duplikate der Hauptseite (sofern dies nicht der Fall ist, ist die Verwendung eines kanonischen Links sinnvoll). .

Natürlich können Sie kanonische Links bereitstellen, aber zu sich selbst . Geben Sie in einem solchen Fall auf der Seite https://website.com/product-category/ Folgendes ein:

 <link rel="canonical" href="https://website.com/product-category" />

und Folgendes auf Seite https://website.com/product-category/page-2:

 <link rel="canonical" href="https://website.com/product-category/page-2" />

Eine Seite mit allen Inhalten

Es gibt eine Ausnahme – eine Basisseite mit allen Inhalten , zusätzlich unterteilt in einige Unterseiten mit weniger Inhalt. In einer solchen Situation ist es sinnvoll, einen Canonical Link zu verwenden. Es ist eine Praxis, die oft in ziemlich langen Artikeln mit viel Inhalt verwendet wird.

Also folgende Seiten:

https://website.com/product-category/page-1
https://website.com/product-category/page-2
https://website.com/product-category/page-3
https://website.com/product-category/page-4

In einer einzigen logischen Sequenz zusammengefasst, enthält sie tatsächlich alle Inhalte auf der Basisseite https://website.com/produktkategorie/, die Sie für die Suchmaschinenindizierung verwenden möchten.

Diese unglückliche erste Paginierungsseite…

Ein weiterer Fehler ist das Duplizieren der Kategorie-Basisseite https://website.com/product-category/ mit der ersten Paginierungsseite https://website.com/product-category/page-1

Wenn die Basisseite den gleichen Inhalt wie /page-1 enthält, ist es sinnlos, ein Duplikat zu erstellen – bestimmte Content-Management-Systeme erzeugen normalerweise (neben einer Basisseite) die erste Paginierungsseite, die mit /page-1 beginnt; in einem solchen Fall , sollte die Adresse zB per Redirect 301 auf die Basisseite umgeleitet werden und im Code nicht auf https://website.com/product-category/page-1 sondern auf https://website verlinken. de/Produktkategorie/

Andernfalls tritt ein internes Umleitungsproblem auf, wodurch das Crawl-Budget des Googlebot für das Crawlen einer bestimmten Website verschwendet wird. Mit anderen Worten, es hat keinen Sinn, es mit einem internen Link mit Redirect 301 umzuleiten, wenn Sie mit dem HTTP-Statuscode 200 direkt auf die Zielseite verlinken können.

Die Attribute rel="next" undrel="prev".

Wenn Sie sich entscheiden, wie folgt zu paginieren:

https://website.com/produktkategorie/
https://website.com/product-category/page-2
https://website.com/product-category/page-3
https://website.com/product-category/page-4

dann können Sie einem Crawler Beziehungen zwischen einzelnen Seiten anzeigen. Die Bereitstellung relevanter Links mit rel-Attributen im Abschnitt <head> hebt einzelne Seiten einer Sequenz hervor.

Geben Sie auf der ersten (Basis-)Seite Folgendes ein:

 <link rel="next" href="https://website.com/product-category/page-2">

als eine andere Seite, die einen Teil derselben Ressource enthält.

Geben Sie auf der nächsten Seite , dh https://website.com/product-category/page-2, Folgendes ein:

 <link rel="prev" href="https://website.com/produktkategorie/">
<link rel="next" href="https://website.com/product-category/page-3">

Weiter geht es auf der dritten Seite, also https://website.com/product-category/page-3:

 <link rel="prev" href="https://website.com/product-category/page/page-2">
<link rel="next" href="https://website.com/product-category/page-4">

Angenommen, /page-4 ist das letzte in der Paginierungssequenz , geben Sie dort Folgendes ein:

 <link rel="prev" href="https://website.com/product-category/page-3">

Es ist die am häufigsten verwendete Kombination von Links in einer Überschrift mit „rel next/prev“-Attributen. Manchmal werden den Links „<a href=“ im Code (z. B. unter der Liste) Attribute hinzugefügt, obwohl es besser ist, sie in den Abschnitt <head> zu setzen – je eher ein Crawler einen Hinweis bekommt, wo sich der Rest der Ressource befindet , desto besser.

Dabei ist zu beachten, dass Links mit „rel next/prev“-Attributen keine absoluten Direktiven sind, d.h. sie können, müssen aber nicht beim Crawlen einer Website berücksichtigt werden. Außerdem lohnt es sich, absolute Pfade zu Folgeseiten zu verwenden, obwohl die Google-Richtlinien besagen, dass „Werte absolute Pfade und relative Pfade sein können“. Im Falle einer Seite mit Parametern in einer URL, z. B. Sortierparametern, sollten diese jedoch auch in „rel next/prev“-Links eingefügt werden – beispielsweise die folgende Seite:

https://website.com/product-category/page-3&sort=desc

enthält die folgenden Links im Abschnitt <head>:

 <link rel="prev" href="https://website.com/product-category/page-2&sort=desc">
<link rel="next" href="https://website.com/product-category/page-4&sort=desc">

aber ein kanonisches Tag, das nur auf sich selbst zeigt (ohne den Parameter der Sortierung in absteigender Reihenfolge):

 <link rel="canonical" href="https://website.com/product-category/page-3"/>

Indexieren oder nicht indexieren?

Ein weiteres Problem beim Paginieren ist der Missbrauch von Robots-Meta-Tags. Google behauptete, dass einzelne Seiten als logische Abfolge betrachtet werden müssten, was dazu führen würde, dass Attribute ihrer Links berücksichtigt würden und dem Benutzer in den meisten Fällen dabei helfen würden, die erste Seite anzuzeigen.

Sehr oft kommt es vor, dass einzelne Paginierungsseiten, obwohl sie mit Links mit „rel next/prev“-Attributen miteinander verbunden sind, im Suchmaschinenindex stehen. Wenn Sie damit ein Problem haben, verwenden Sie am besten Folgendes:

 <meta name="robots" content="noindex, follow" />

auf den Folgeseiten, also auf /page-2 und höher. Ein Webcrawler durchsucht die Links bis zur letzten paginierten Seite, indexiert sie jedoch nicht.

Was ist also mit Canonicals?

Aus der Diskussion mit John Mueller (https://plus.google.com/+JohnELincoln/posts/TCJHwdZHdQc) geht eindeutig hervor, dass Sie Meta-Tags ohne Index nicht mit Canonicals kombinieren sollten, die auf eine indexierbare URL verweisen. Wenn also in diesem Fall ein kanonischer Link auf einer Paginierungsseite auf sich selbst verweist, darf kein „kein Index“-Meta-Tag gesetzt werden und umgekehrt.

Ich habe keine Probleme beim Crawlen von paginierten Seiten mit kanonischen Links zu den Seiten selbst und dem Meta-Tag „kein Index“ festgestellt; Google möchte jedoch selbst entscheiden, was indexiert wird und was nicht, also sollten wir es vielleicht Google überlassen.

Paginierung und eine Website-XML-Sitemap

Hier ein interessanter Fall: Sie tragen in einer Sitemap.xml lieber keine Paginierungslinks ein, sondern nur die Basisadresse beispielsweise einer Kategorie oder den Hauptartikel mit allen Inhalten. Grundsätzlich sollten in einer XML-Sitemap die Adressen eingetragen werden, die Sie indexieren möchten, also wenn Sie sich nicht um die Seitenindexierung kümmern, nehmen Sie dort keine URLs zu /page-2 und höher auf. Wenn Sie es mit einem Robots-Meta-Tag „kein Index“ blockieren, ist es natürlich noch einfacher – geben Sie sie nicht an.

Paginierungsseiten als Parameter

Wenn Sie die Indexierung von Produkten/Artikeln von der letzten paginierten Seite aus unterstützen möchten, bieten Sie Webcrawlern uneingeschränkten Zugriff auf Seiten anderer Kategorien jenseits der Basiskategorie. Häufig kommt es vor, dass einzelne Seiten „ ?page= “ oder „ ?p= “ Parameter haben und fälschlicherweise zusammen mit den restlichen Parametern in der robots.txt blockiert werden können.

Ähnlich verhält es sich mit URL-Parametern in der Google Search Console . Es lohnt sich, dem Googlebot zu zeigen, dass solche Parameter dafür verantwortlich sind, Ressourcen in Seiten aufzuteilen und den Bot entscheiden zu lassen.

Paginierung und Beschreibungen der Kategorien

Eine häufig praktizierte Praxis ist das Erweitern von Kategorieinhalten, zB in Online-Shops. Häufig kommt es vor, dass eine hinzugefügte Beschreibung bei allen Paginierungs-URLs in unveränderter Form angezeigt wird. Wenn alle Seiten als logische Folge behandelt und durch „rel next/prev“-Attribute zu einem Ganzen kombiniert werden, erscheint es unnötig, denselben Text auf /page-2, /page-3 usw. zu duplizieren.

Ähnlich verhält es sich mit den gelisteten Produkten: Jede weitere Seite zeigt eine neue Produktpalette, und der Benutzer möchte weder auf jeder Seite immer die gleiche Kategoriebeschreibung lesen noch sich die gleichen Produkte innerhalb der Kategorie weiter ansehen . Es gibt jedoch eine Frage – wer liest Kategoriebeschreibungen? Googlebot tut dies wahrscheinlich, also füttern Sie ihn nicht mit Duplikaten.

Benötigen Sie eine Paginierung, wenn Sie eine unendliche Schriftrolle verwenden?

Es stellt sich heraus, dass Paginierung auch in der „Infinite Scroll“-Lösung eine praktikable Option ist, bei der durch Herunterscrollen der Liste von Produkten/Artikeln innerhalb einer Kategorie neue Ressourcen angezeigt werden. John Mueller (http://scrollsample.appspot.com/items) lieferte ein sinnvolles Beispiel: Beim Scrollen der Liste werden der URL neue Parameter hinzugefügt, die auf Folgeseiten verweisen.

http://scrollsample.appspot.com/items?page=2
http://scrollsample.appspot.com/items?page=3

und so weiter und so fort.

Offensichtlich werden hier Links mit „rel next/prev“-Attributen verwendet und es wird ein kanonischer Link zu sich selbst bereitgestellt; unter http://scrollsample.appspot.com/items?page=5 lautet es beispielsweise wie folgt:

 <link rel="canonical" href="/items?page=5" />
<link rel="next" href="/items?page=6"/>
<link rel="prev" href="/items?page=4"/>

Senuto jetzt starten Kostenlos registrieren

Paginierung als Element einer Indizierungsstrategie

Die Entscheidung, eine bestimmte Paginierungslösung einzusetzen, liegt natürlich bei Ihnen. Die vorstehenden Beispiele sind nicht in jeder Situation perfekte Optionen, da Sie möglicherweise auf technische Schwierigkeiten oder CMS-Probleme stoßen oder einfach gegen eine angenommene Indexierungsstrategie verstoßen. Es lohnt sich jedoch, die Paginierung so weit zu optimieren, dass der Googlebot zumindest nicht vom Crawlen der Website abgehalten wird, sowie die Indexierung von vergrabenen Produkt-/Artikelseiten zu fördern, die während eines einzelnen Besuchs nicht so leicht zugänglich sind.

Senuto jetzt starten Kostenlos registrieren