Que sont les balises canoniques et quand les utiliser

Publié: 2022-11-03

Une balise canonique, souvent appelée rel="canonical", est une balise HTML qui indique aux moteurs de recherche quelle URL est la version principale ou "copie principale" du contenu. Ces balises simples permettent aux propriétaires de sites de suggérer une URL que Google désignera comme la page préférée à afficher dans les recherches. Les balises canoniques empêchent également les problèmes de référencement liés au contenu dupliqué.

Ces simples éléments de liens HTML jouent un rôle majeur dans le référencement de votre site. Ils sont également faciles à utiliser, mais ne fonctionnent que lorsqu'ils sont utilisés correctement. Si vous n'êtes pas familier avec les balises canoniques, cet article vous aidera à savoir comment, quand et pourquoi utiliser les balises canoniques et comment éviter les problèmes de balises canoniques.

Qu'est-ce qu'une balise canonique ?

comment les balises canoniques fonctionnent avec une version en double pointant vers la version principale

Une balise canonique est un élément de lien HTML inséré dans l'en-tête ou <head> d'une page. Ces balises ont été développées par les moteurs de recherche et déployées en 2009. C'est l'un de ces excellents exemples de moteurs de recherche travaillant avec les propriétaires de sites pour améliorer la qualité des résultats de recherche.

Les balises canoniques indiquent aux moteurs de recherche l'une des choses suivantes :

  1. Ce contenu sur une page est un doublon d'une autre page en plus de laquelle des pages doit être considérée comme la version principale.
  2. Pour les pages uniques avec plusieurs URL, la balise indique aux robots Google ou Bing quelle URL exacte est la bonne à indexer.

Cette balise indique au robot d'indexation d'indexer la page principale plutôt que le doublon. L'URL canonique indique à Google quelle page le moteur de recherche doit afficher dans les résultats du moteur de recherche, cette balise indique au moteur de recherche que la version principale est celle qui doit recevoir la visibilité de la recherche organique.

N'oubliez pas que même si vous pouvez indiquer à Google quelle URL indexer, Google peut ne pas suivre votre recommandation .

Une balise canonique ressemble à ceci :

exemple de balise canonique

Ou

<link rel= "canonique" href= " https://example.com " />

Quelles sont les parties d'une balise canonique ?

Une répartition de toutes les parties d'une balise canonique

Une balise canonique est également appelée élément de lien canonique, qui est une étiquette un peu plus intuitive pour ce code HTML unique. Pourquoi? Parce qu'une balise canonique fournit un lien canonique et définit la relation entre la page et le lien.

En HTML, rel indique au Googlebot qu'il existe une relation entre la page et une ressource liée. Dans ce cas, la relation identifie la page canonique qui apparaît après l'attribut href (href est une référence hypertexte).

Qu'est-ce qu'une URL canonique

Une URL canonique est la version principale d'une page Web que les propriétaires de sites veulent que les moteurs de recherche reconnaissent comme la source principale du contenu. L'URL canonique est la page Web que vous souhaitez que les robots d'indexation indexent comme source correcte du contenu. Cette partie de l'élément de lien apparaît après le href="canonicalURL".

Une balise canonique est-elle identique à une URL canonique ?

une balise canonique vs URL canonique

L'URL canonique apparaît dans la balise canonique. L'URL canonique est l'élément de référence du lien hypertexte dans la balise canonique. Cela indique l'URL exacte qui doit être considérée comme la version canonique du contenu source.

Pourquoi la canonisation est-elle importante ?

En ce qui concerne les sites de commerce électronique et les sites qui génèrent des revenus publicitaires, vous voulez être sûr de saisir toutes les occasions de mettre en avant votre meilleure URL dans les pages de résultats des moteurs de recherche (SERP). Et la canonisation fait exactement cela en indiquant à Google quel site doit être indexé. Non seulement vous pouvez mieux contrôler votre site, mais vous pouvez également diriger les utilisateurs vers la page la plus intéressante.

Devriez-vous utiliser des balises canoniques auto-référentielles ?

Même une page Web qui peut sembler unique peut être trouvée sous une variété d'URL. Par exemple:

Un diagramme montrant les variantes d'une URL comme exemple de fonctionnement des balises canoniques

Bien que chacune de ces URL affiche la même page d'accueil, chacune est aussi techniquement sa propre URL. Cela peut entraîner les mêmes problèmes que d'avoir du contenu en double sur un site Web tiers. Sans balise canonique sur linkgraph.io, les algorithmes des moteurs de recherche ne sauront pas quelle est l'URL préférée à afficher pour les chercheurs.

Rendant les choses encore plus déroutantes pour les moteurs de recherche, les pages dynamiques ont souvent un large éventail de balises, chacune ayant sa propre URL. Les systèmes de gestion de contenu (CMS) comme WordPress intègrent également souvent automatiquement des balises dans les pages Web. Ainsi, même une page de base se retrouvera avec une multitude d'URL, chacune parfaitement indexable par les moteurs de recherche.

Donc, votre meilleur pari est de placer également une balise canonique dans l'en-tête de l'URL canonique.

Les balises canoniques rationalisent la collecte et l'analyse des données

De plus, lorsque vous suivez vos statistiques de recherche, vous souhaitez compiler toutes les recherches organiques pour une page sous la même URL. Vos balises canoniques garantissent que seule la page spécifiée recevra des mesures de résultats de recherche.

Prévenir les conflits SEO avec le contenu syndiqué

De nombreux sites Web créent des backlinks grâce à la syndication de contenu. Cependant, la création de contenu peut être un investissement opportun et coûteux. Grâce à des relations syndiquées, vous pouvez fournir aux utilisateurs votre contenu existant de haute qualité sur des sites tiers. Ou continuez à développer votre bibliothèque de contenu sur votre site tout en élargissant la visibilité de votre marque.

Cependant, sans balises canoniques, les moteurs de recherche ne sauront pas s'il faut indexer votre site pour l'article ou le tiers. Les balises canoniques vous permettent, à vous et à votre partenaire de syndication, de simplifier ce problème. Remarque : vous pouvez également utiliser la balise noindex sur l'une des pages pour éviter la duplication.

Quel est le problème avec le contenu dupliqué ?

Le contenu dupliqué peut causer divers problèmes liés au référencement. Lorsque Googlebots indexe des pages Web avec un contenu identique ou très similaire, il peut :

  • Ralentissez le processus d'indexation, ce qui réduira le nombre d'indexation de votre site.
  • Enregistrez-vous en tant que signal de classement négatif vers Google, ce qui fait que vos pages se classent plus bas dans les SERP.
  • Confondre le moteur de recherche quant à la page qu'il doit afficher aux internautes.

Comment les balises canoniques aident le référencement

Avant tout, les balises canoniques sont l'un des rares moyens d'influencer la manière dont Google présente votre site aux internautes. La canonisation vous empêche également d'être «ancré» dans le PageRank pour avoir du contenu en double - bien que Google ne pénalise pas directement le contenu en double , ils donnent la priorité au contenu original qui est bien organisé,

Enfin, ils vous permettent également de fournir aux utilisateurs au-delà de votre site Web un excellent contenu pour le backlinking et la création de marque.

Qu'est-ce que le contenu dupliqué ?

ce qui compte comme contenu dupliqué

Le contenu dupliqué n'est pas simplement du texte copié-collé. Il peut s'agir de texte écrit, d'images et d'autres supports qui sont exactement identiques, similaires ou réorganisés. Google prend également en compte le texte et les images de remplissage de lieu d'un contenu en double CMS s'il est publié sur le Web.

Les informations de base, telles que le texte de copyright, sur chaque page de votre site peuvent même être signalées comme doublons.

Comment utiliser les balises canoniques

En fin de compte, pour obtenir les meilleurs résultats de référencement, vous souhaiterez utiliser des balises canoniques sur l'ensemble de votre site Web. Une fois que vous aurez mis à jour vos pages existantes, vous souhaiterez continuer à mettre en œuvre les meilleures pratiques de canonisation.

La première étape consiste à identifier quelle version d'URL des pages de votre site doit être l'URL canonique. Google préfère si vos liens canoniques sont cohérents dans le formatage. Donc, si vous utilisez le "www." dans le lien canonique de votre page d'accueil, incluez-le dans vos autres URL canoniques.

Par exemple, chez LinkGraph, nous utilisons le protocole "https" dans toutes nos balises canoniques, mais n'incluons pas le "www".

exemple de balise canonique

Cela résoudra tous les problèmes avec plusieurs URL pointant vers la même page.

Ensuite, vous voudrez baliser ou éliminer tout contenu en double sur votre site. Vous pouvez le faire avec l'outil d'audit de site de SearchAtlas. C'est aussi simple que de consulter votre rapport Contenu/Doublons.

rapport de contenu dupliqué

Enfin, vous voudrez trouver tout contenu en double restant sur des sites tiers. Vous pouvez utiliser un outil tel que Copyscape pour le faire. Une fois que vous aurez identifié du contenu ailleurs sur le Web, vous voudrez décider si

  1. Votre contenu a été volé et republié sans autorisation
  2. Vous avez accidentellement plagié un contenu préexistant ou écrit un contenu trop similaire à celui d'une autre page
  3. Une page syndiquée s'enregistre en tant que doublon
  4. Vous avez des pages avec un contenu identique mais approprié, comme un produit apparaissant sur deux pages de catégories différentes

Ensuite, vous voudrez répondre avec les solutions correspondantes :

  1. Signaler le doublon à Google
  2. Supprimez immédiatement le contenu et produisez un contenu original de haute qualité
  3. Discutez avec votre partenaire de syndication de la page qui doit être l'URL canonique, puis implémentez une balise canonique qui reflète l'URL canonique correcte.
  4. Utiliser la balise canonique avec l'URL canonique désignée

Quand utiliser les balises canoniques

En ce qui concerne les balises canoniques, vous pouvez réduire les problèmes de contenu en double en utilisant toujours des balises canoniques. Cependant, si vous mettez à jour votre site, vous souhaitez donner la priorité :

  • Pages de catégories de produits avec filtrage des variations : cela inclut différentes tailles, marques, couleurs et quantités. Chacune de ces variantes nécessite une URL différente.
  • Articles et pages qui utilisent la pagination : il s'agit souvent de longs blogs qui ont été divisés en plusieurs pages.
  • Pages de produits qui apparaissent sur plusieurs pages de catégories.
  • Pages ayant un contenu similaire, telles que des informations sur votre entreprise.

Implémenter des balises canoniques sur votre site Web

Faut-il être webmaster pour implémenter des balises canoniques ? Pas nécessairement. Si vous êtes à l'aise avec le travail sur le code HTML de votre site, vous pouvez implémenter vous-même des balises canoniques.

Voici comment configurer les balises canoniques :

Balises canoniques dans les en-têtes HTTP

Le moyen le plus simple d'utiliser vos balises canoniques consiste à insérer et à mettre à jour le texte de la balise dans votre en-tête HTTP. Cette section d'en-tête HTTP de votre page ressemble à ceci balise d'en-tête

1. Identifiez votre URL canonique préférée.

2. Ajoutez une balise de lien rel=canonical à la section <head> de la page non canonique avec le lien URL canonique correct inséré dans la balise de lien HTML.

Ça devrait ressembler à ça:

exemple de configuration de texte pour une balise canonique

Version copier-coller :

<link rel= "canonical" href= "https://votresite/pagecanonical" />

C'est tout ce qu'on peut en dire. Il n'est pas nécessaire d'être un webmaster pour créer un lien vers la version canonique d'une page.

Vérification de votre balise canonique

Pour vérifier si vous avez correctement implémenté votre balise canonique avec la bonne URL, vous devrez afficher le code source de votre page Web. Ce processus est facile.

  1. Tout d'abord, accédez à la version d'une page Web ou d'un élément de contenu que vous souhaitez vérifier à l'aide de votre navigateur.
  2. Ensuite, faites un clic droit n'importe où dans la page et sélectionnez Inspecter. Cela ouvrira le code source d'une page (ou d'un outil d'inspection d'URL) pour votre site ou tout autre site afin d'afficher les éléments de lien canoniques des autres. Outil d'inspection HTML
  3. Une fois votre menu de code source HTML ouvert, appuyez sur Ctrl + f pour Windows ou f + commande pour Mac. Tapez ensuite "canonical" dans la recherche par chaîne, sélecteur ou XPath. trouver la balise canonique dans le html
  4. Le mot "canonique" apparaîtra et surlignera en jaune, ce qui rendra l'en-tête facile à voir pour vérification. Vérifiez que l'URL canonique est correcte. Si aucun résultat n'apparaît, la page n'a pas de balise HTML canonique.

Autres façons de vérifier les balises canoniques

Google Search Console et GSC Insights sont d'excellents outils pour trouver des pages mal balisées. Lorsque vous parcourez vos statistiques de trafic organique et remarquez que le trafic de recherche arrive sur une page non canonique, vos balises canoniques peuvent être incorrectes.

Pour réparer ces pages, vous devrez naviguer vers l'URL spécifique, puis inspecter la page.

URL canoniques dans votre sitemap

Lors de la création ou de la mise à jour de votre sitemap, n'incluez pas d'URL en double. Il vous suffit d'inclure vos URL canoniques. L'inclusion de la version canonique d'une page dans votre sitemap incitera les robots de Google à ne pas explorer la version dupliquée du contenu.

Devriez-vous exclure les pages en double dans votre fichier Robots.txt ?

Vous ne devez pas interdire les pages en double dans votre fichier robots.txt . Cela empêcherait Google d'utiliser les signaux de classement de ces pages. Lorsque vous implémentez correctement les balises canoniques, les signaux de classement, tels que les engagements (clics, défilements, saisie de texte) et les signaux de contenu seront pris en compte dans les métriques de la page canonique.

Comment utiliser les balises canoniques dans votre CMS

Si vous modifiez votre site via une plateforme CMS telle que WordPress, Shopify, Wix ou BigCommerce. La plupart de ces CMS auront des instructions spécifiques pour ajouter des balises de lien canoniques, sans modifier directement votre document HTML. Nous couvrirons les plates-formes CMS les plus courantes.

Utilisation de Yoast pour les balises canoniques dans les sites Wix, Shopify ou WordPress

En utilisant le plugin Yoast SEO pour WordPress, Shopify ou Wix, vous pouvez facilement modifier et ajouter l'URL préférée comme balise canonique.

  1. Après avoir ajouté le plugin Yoast SEO, vous trouverez le menu Avancé en bas de l'édition Yoast. Ouvrez ce menu. balises canoniques comment dans yoast
  2. Entrez la version de l'URL que vous souhaitez désigner comme URL canonique. comment associer des balises canoniques à une page wordpress via yoast

Ne faites pas ces 8 erreurs de balise canonique

Les balises canoniques ne fonctionnent bien que lorsqu'elles sont correctement implémentées - et une implémentation incorrecte peut être un désastre. Heureusement, il existe des erreurs courantes que vous pouvez éviter pour vous assurer que votre site de commerce électronique ou votre site de revenus publicitaires tire le meilleur parti de votre prochaine exploration Google.

Si vous remarquez que vous recevez du trafic organique vers une version non préférée d'une page, vous voudrez vérifier les problèmes suivants :

1. N'utilisez pas de redirections 301 au lieu de liens canoniques

301 n'est pas égal à une balise canonique

Google et d'autres moteurs de recherche ont créé des attributs canoniques pour améliorer l'organisation des sites Web et améliorer l'expérience utilisateur. Lorsque vous utilisez des redirections 301 , vous augmentez le temps de chargement de votre page. En effet, le serveur doit récupérer l'URL redirigée avant de récupérer l'autre version d'une page.

De plus, lorsque vous optez pour une redirection au lieu d'un attribut canonique, vous envoyez le mauvais signal aux Googlebots.

2. Liens internes et balises canoniques

Ne sélectionnez pas une page sans aucun lien interne pointant vers elle comme votre version canonique. Les balises canoniques ne sont que des indices pour les robots d'exploration, et si votre URL canonique n'apparaît pas dans votre sitemap, il y a de fortes chances qu'elle ne soit pas indexée.

3. Utiliser 'noindex' sur n'importe laquelle de vos pages en double

Il n'est pas nécessaire d'empêcher Googlebots d'indexer vos pages en double. En fait, vous voulez que vos pages en double transmettent leur équité de lien et d'autres signaux de qualité sur votre page canonique.

Noindex doit être réservé au contenu fermé et à tout autre contenu que vous souhaitez masquer des résultats de recherche.

4. Empêcher les codes d'état 4XX pour l'URL canonisée

erreur 404

Assurez-vous de saisir correctement l'URL de votre lien canonique. Si vous n'êtes pas sûr de la version à utiliser, envisagez de faire de l'URL absolue votre URL par défaut.

Une URL absolue doit inclure le protocole (HTTPS), le nom de domaine ( www.yourhomepage.com ) et tous les sous-dossiers (/subfolder). N'oubliez pas que vous souhaitez utiliser le protocole HTTPS pour démontrer que votre site dispose d'une sécurité SSL pour vos utilisateurs.

Et vérifiez toujours que votre URL préférée a été correctement orthographiée. C'est la raison la plus courante d'une erreur 404.

5. Canonicalisation de toutes les pages paginées sur la page racine

explication et exemple de contenu paginé

Lorsque vous créez des articles de blog ou des guides avec plusieurs pages Web, ne créez pas de lien canonique vers la première page de la série à partir des pages suivantes. Cela empêchera un Googlebot d'indexer la série complète. Au lieu de cela, vous voudrez remplacer rel = "canonical" par rel = "prev" et rel = "next".

6. Ne pas utiliser les canoniques avec les balises Hreflang

Les balises hreflanf indiquent à Google qu'une page apparaît dans plusieurs langues pour mieux servir un public diversifié et multirégional. Des versions linguistiques différentes peuvent être considérées comme des doublons de contenu. Par conséquent, Google demande aux webmasters de toujours utiliser les balises Hreflang conjointement avec les balises canoniques.

7. Utilisation de plusieurs balises canoniques sur une seule page

Un problème souvent négligé est l'utilisation accidentelle de plusieurs balises rel=canonical. Ce problème peut survenir lorsque plusieurs personnes modifient une page. Heureusement, il est facile à réparer et facile à éviter si vous en êtes conscient.

8. Fautes de frappe de base dans l'URL canonique

Si vous avez inséré une balise canonique, mais remarquez que le trafic organique arrive sur la page non préférée, vérifiez que tous les éléments sont correctement placés. Notez que l'un des caractères les plus souvent ignorés est la barre oblique de fin.

Adoptez les balises canoniques et profitez de meilleurs résultats de référencement

Si vous n'utilisez pas de balises canoniques, vous passez probablement à côté. Les balises canoniques peuvent empêcher une multitude de problèmes de contenu en double résultant de variantes d'URL, ce qui se traduit par de meilleures performances de référencement et un site plus organisé à explorer par Google. De plus, lorsque vous implémentez des balises canoniques, toutes vos mesures de recherche seront compilées dans une page bien rangée plutôt que dans d'innombrables variantes.

Gardez une longueur d'avance sur vos statistiques de recherche et tirez le meilleur parti de vos données consolidées grâce au meilleur outil de suivi des mots clés disponible .