Pagination - un élément crucial de l'indexation des moteurs de recherche

Publié: 2017-11-08

Table des matières

    Les directives de référencement sur la pagination, par exemple des catégories de boutiques en ligne ou des articles de blog, sont un sujet récurrent et il existe quelques approches. Nous allons discuter de la façon d'aborder la pagination pour aider les robots d'exploration Web à traiter le contenu plus facilement.

    Qu'est-ce que la pagination ?

    La pagination consiste simplement à diviser une ressource spécifique sur un site Web en pages. L'exemple le plus simple peut être les catégories dans la majorité des magasins en ligne où, après avoir répertorié un nombre spécifique de produits, l'utilisateur peut accéder à la partie suivante de la liste de produits. Une autre façon de présenter les produits au sein d'une catégorie est la pagination à défilement infini où, lorsque l'utilisateur fait défiler vers le bas, les produits nouveaux et nouveaux sont affichés. Il en est de même pour les blogs. Généralement, peu importe quelle ressource d'un site Web est divisée en parties, il s'agit plutôt de la façon dont vous le faites et de la façon dont vous informez Googlebot du contenu qui suit.

    Laissez les robots d'indexation faire ce qu'ils font

    L'une des erreurs de base commises lors de la pagination consiste à utiliser des balises canoniques sur la première page de pagination. Et même si cela est justifié dans une situation, cela se fait généralement de manière incorrecte.

    Si, par exemple, une catégorie de produits est divisée en quelques pages, cela signifie que la page de base comprend un certain nombre de produits, la deuxième page comprend un autre groupe de produits, et ainsi de suite, jusqu'à la dernière page de pagination.

    Les pages de pagination sont les suivantes :

    https://website.com/product-category/page-2
    https://website.com/product-category/page-3
    https://website.com/product-category/page-4

    etc.

    par conséquent, cela n'a pas beaucoup de sens d'utiliser de tels liens canoniques :

     <link rel="canonical" href="https://website.com/product-category" />

    du fait qu'il s'agit d'une autre partie des produits d'une catégorie donnée, les pages 2,3,4, etc. ne sont pas des doublons de la page principale (sauf si ce n'est pas le cas, alors utiliser un lien canonique est raisonnable) .

    Naturellement, vous pouvez fournir des liens canoniques, mais à eux-mêmes . Dans ce cas, entrez ce qui suit sur la page https://website.com/product-category/ :

     <link rel="canonical" href="https://website.com/product-category" />

    et ce qui suit sur la page https://website.com/product-category/page-2 :

     <link rel="canonical" href="https://website.com/product-category/page-2" />

    Une page avec tout le contenu

    Il y a une exception - une page de base avec tout le contenu , en plus divisé en quelques sous-pages avec moins de contenu. Dans une telle situation, il est logique d'utiliser un lien canonique. C'est une pratique souvent utilisée dans des articles assez longs avec beaucoup de contenu.

    Ainsi, les pages suivantes :

    https://website.com/product-category/page-1
    https://website.com/product-category/page-2
    https://website.com/product-category/page-3
    https://website.com/product-category/page-4

    combinés en une seule séquence logique incluront en fait tout le contenu de la page de base https://website.com/product-category/ que vous souhaitez utiliser pour l'indexation des moteurs de recherche.

    Cette malheureuse première page de pagination…

    Une autre erreur consiste à dupliquer la page de base de la catégorie https://website.com/product-category/ avec la première page de pagination https://website.com/product-category/page-1

    Si la page de base comporte le même contenu que /page-1, alors il est inutile de faire un duplicata – certains systèmes de gestion de contenu génèrent normalement (à côté d'une page de base) la première page de pagination commençant par /page-1 ; dans ce cas , l'adresse doit par exemple être redirigée vers la page de base à l'aide de Redirect 301 , et dans le code, vous devez fournir un lien non pas vers https://website.com/product-category/page-1 mais plutôt vers https://website. com/product-category/

    Sinon, vous rencontrerez un problème de redirection interne, gaspillant ainsi le budget de crawl de Googlebot pour crawler un site Web donné. En d'autres termes, il est inutile de le rediriger avec un lien interne à l'aide de la redirection 301 lorsque vous pouvez accéder directement à la page de destination à l'aide du code d'état HTTP 200.

    Les attributs rel="next"andrel="prev"

    Si vous décidez de paginer comme suit :

    https://website.com/product-category/
    https://website.com/product-category/page-2
    https://website.com/product-category/page-3
    https://website.com/product-category/page-4

    vous pouvez ensuite indiquer les relations entre les pages individuelles à un robot d'exploration. Fournir des liens pertinents avec des attributs rel dans la section <head> met en évidence les pages individuelles d'une séquence.

    Sur la première page (de base) , mettez ce qui suit :

     <link rel="next" href="https://website.com/product-category/page-2">

    comme une autre page contenant une partie de la même ressource.

    Sur la page suivante , c'est-à-dire https://website.com/product-category/page-2, mettez ce qui suit :

     <link rel="prev" href="https://website.com/product-category/">
    <link rel="next" href="https://website.com/product-category/page-3">

    Passons à la troisième page, c'est-à-dire https://website.com/product-category/page-3 :

     <link rel="prev" href="https://website.com/product-category/page/page-2">
    <link rel="next" href="https://website.com/product-category/page-4">

    En supposant que /page-4 est le dernier dans la séquence de pagination , mettez-y ce qui suit :

     <link rel="prev" href="https://website.com/product-category/page-3">

    C'est la combinaison de liens la plus fréquemment utilisée dans un titre avec les attributs « rel next/prev ». Il y a parfois des attributs ajoutés aux liens "<a href=" dans le code (par exemple sous la liste), bien qu'il soit préférable de les mettre dans la section <head> - plus tôt un crawler obtient un indice où se trouve le reste de la ressource , le meilleur.

    Vous devez vous rappeler que les liens avec les attributs "rel next/prev" ne sont pas des directives absolues , c'est-à-dire qu'ils peuvent, mais ne doivent pas être pris en considération lors de l'exploration d'un site Web. De plus, il vaut la peine d'utiliser des chemins absolus vers les pages suivantes, bien que les directives de Google indiquent que "les valeurs peuvent être des chemins absolus et des chemins relatifs". Cependant, dans le cas d'une page avec des paramètres dans une URL, par exemple des paramètres de tri, ils doivent également être mis dans des liens "rel next/prev" - par exemple, la page suivante :

    https://website.com/product-category/page-3&sort=desc

    inclura les liens suivants dans la section <head> :

     <link rel="prev" href="https://website.com/product-category/page-2&sort=desc">
    <link rel="next" href="https://website.com/product-category/page-4&sort=desc">

    mais une balise canonique pointant uniquement vers elle-même (sans le paramètre de tri par ordre décroissant) :

     <link rel="canonical" href="https://website.com/product-category/page-3"/>

    Indexer ou ne pas indexer ?

    Un autre problème rencontré lors de la pagination est l'utilisation abusive des balises méta des robots. Google a affirmé que les pages individuelles doivent être considérées comme une séquence logique qui se traduira par la prise en compte des attributs de leurs liens et dans la plupart des cas, aidera l'utilisateur à afficher la première page.

    Il arrive très souvent que des pages de pagination individuelles, bien qu'elles soient reliées les unes aux autres par des liens avec les attributs « rel next/prev », se trouvent dans l'index du moteur de recherche. Si vous avez un problème avec cela, il sera préférable d'utiliser ce qui suit :

     <meta name="robots" content="noindex, follow" />

    sur les pages suivantes, c'est-à-dire sur /page-2 et plus. Un robot d'exploration Web explorera les liens jusqu'à la dernière page paginée, mais ne les indexera pas.

    Et les canoniques alors ?

    Il ressort clairement de la discussion avec John Mueller (https://plus.google.com/+JohnELincoln/posts/TCJHwdZHdQc) que vous ne devez pas combiner les balises méta « sans index » avec des canoniques pointant vers une URL indexable. Par conséquent, dans ce cas, si un lien canonique sur une page de pagination se dirige vers lui-même, une balise méta "sans index" n'est pas à mettre et inversement.

    Je n'ai remarqué aucun problème avec l'exploration des pages paginées avec des liens canoniques vers les pages elles-mêmes et la balise méta "sans index" ; cependant, Google veut décider par lui-même ce qu'il faut indexer et ce qu'il ne faut pas indexer, alors peut-être devrions-nous laisser Google le faire.

    Pagination et plan de site XML du site Web

    Voici un cas intéressant : vous ne devez pas saisir de liens de pagination dans un sitemap.xml, mais uniquement l'adresse de base d'une catégorie, par exemple, ou l'article principal avec tout le contenu. En principe, dans un plan de site XML, il convient d'entrer les adresses que vous souhaitez indexer, donc si vous ne vous souciez pas de l'indexation de la pagination, n'y incluez pas les URL vers /page-2 et supérieur. Naturellement, si vous le bloquez avec une balise meta robots "sans index", c'est encore plus simple - ne les fournissez pas.

    Pages de pagination comme paramètres

    Si vous souhaitez prendre en charge l'indexation des produits/articles à partir de la dernière page paginée, fournissez aux robots d'indexation Web un accès illimité aux pages des autres catégories au-delà de la catégorie de base. Il arrive souvent que des pages individuelles aient des paramètres « ?page= » ou « ?p= » et peuvent être bloquées par erreur dans robots.txt avec le reste des paramètres.

    Il en va de même pour les paramètres d'URL dans Google Search Console . Cela vaut la peine de montrer à Googlebot que de tels paramètres sont responsables de la division des ressources en pages et de laisser le bot décider.

    Pagination et descriptions des catégories

    Une pratique fréquemment suivie consiste à étendre le contenu des catégories, par exemple dans les magasins en ligne. Il arrive souvent qu'une description ajoutée soit affichée à toutes les URL de pagination sous une forme inchangée. Si toutes les pages sont traitées comme une séquence logique et combinées en un tout par les attributs « rel next/prev », alors il semble inutile de dupliquer le même texte sur /page-2, /page-3, etc.

    C'est similaire en ce qui concerne les produits répertoriés : chaque page suivante affiche un nouvel ensemble de produits, et l'utilisateur ne veut ni lire la même description de catégorie tout le temps sur chaque page ni regarder les mêmes produits plus loin dans la catégorie. . Il y a cependant une question - qui lit les descriptions des catégories ? Googlebot le fait probablement, alors ne l'alimentez pas avec des doublons.

    Avez-vous besoin d'une pagination si vous utilisez un défilement infini ?

    Il s'avère que la pagination est une option viable également dans la solution "défilement infini", où en faisant défiler la liste des produits/articles dans une catégorie, de nouvelles ressources sont affichées. John Mueller (http://scrollsample.appspot.com/items) a fourni un exemple judicieux : lors du défilement de la liste, de nouveaux paramètres pointant vers les pages suivantes sont ajoutés à l'URL.

    http://scrollsample.appspot.com/items?page=2
    http://scrollsample.appspot.com/items?page=3

    et ainsi de suite.

    Évidemment, ici sont utilisés des liens avec les attributs « rel next/prev » et fournis est un lien canonique vers lui-même ; par exemple, sur http://scrollsample.appspot.com/items?page=5, c'est comme suit :

     <link rel="canonical" href="/items?page=5" />
    <link rel="next" href="/items?page=6"/>
    <link rel="prev" href="/items?page=4"/>

    Lancez Senuto maintenant Enregistrez-vous gratuitement

    La pagination comme élément d'une stratégie d'indexation

    La décision d'appliquer une solution de pagination particulière vous appartient naturellement. Les exemples précédents ne sont pas des options parfaites dans toutes les situations car vous pouvez rencontrer des difficultés techniques, des problèmes de CMS ou simplement cela est contraire à une stratégie d'indexation adoptée. Cependant, il convient d'optimiser la pagination de manière à au moins ne pas empêcher Googlebot d'explorer le site Web, ainsi que de favoriser l'indexation de pages de produits/articles enfouies qui ne sont pas facilement accessibles lors d'une seule visite.

    Lancez Senuto maintenant Enregistrez-vous gratuitement