Sitemaps XML : tout ce que vous devez savoir pour le référencement

Publié: 2019-01-25

À quand remonte la dernière fois que vous avez utilisé une carte ?

Je ne me souviens même pas d'être honnête.

Mais les plans de site - les plans de site sont plus pertinents que jamais en matière de référencement.

Pendant des années, j'ai simplement soumis des sitemaps à Google Search Console parce que j'avais entendu dire que c'était la meilleure pratique, j'ai coché la case et je suis passé à autre chose.

Je ne comprenais pas entièrement pourquoi je l'avais fait et j'étais pleine d'idées fausses.

Mais les sitemaps XML ne sont pas seulement une case à cocher.

Les sitemaps sont un outil puissant, et en tant que SEO, il est crucial que vous compreniez leur contexte, les tenants et les aboutissants et les meilleures pratiques.

Sitemaps XML : tout ce que vous devez savoir pour le référencement

Qu'est-ce qu'un sitemap XML ?

En termes simples, un sitemap XML est un répertoire ou un guide contenant les pages les plus importantes d'un site Web. Ils sont destinés à aider les robots d'exploration à comprendre votre site Web et sa structure.

Un sitemap est un fichier XML (Extensible Markup Language) facilement digéré par les moteurs de recherche. Cela ressemble à ceci :

Il ne s'agit que d'une seule URL et présente toutes les balises disponibles selon sitemaps.org, mais la seule balise requise est l'emplacement, l'URL de la page.

Yoast, un outil de référencement populaire pour les sites Web WordPress, génère des sitemaps qui ressemblent à ceci :

Comme mentionné, la fonction principale d'un sitemap est d'aider les moteurs de recherche à comprendre les sites Web. Les sitemaps XML le font en indiquant trois choses importantes :

  1. Les pages les plus importantes d'un site Web.
  2. Structure et architecture du site.
  3. Depuis combien de temps les pages ont été mises à jour.

2 idées fausses courantes sur les sitemaps XML

Avant de nous plonger dans la génération d'un sitemap, ce qu'il faut inclure et ce qu'il faut exclure, abordons deux idées fausses très courantes.

1. Chaque page doit être incluse

Comme indiqué ci-dessus, un sitemap doit présenter les pages les plus importantes d'un site Web. La théorie est que seules les pages de votre site que vous souhaitez trouver sur les moteurs de recherche doivent être incluses dans votre sitemap.

Si possible, vous devez faire de votre mieux pour diviser les pages de votre site en deux catégories : celles sur lesquelles vous souhaitez que les utilisateurs accèdent à partir des moteurs de recherche et celles que vous ne souhaitez pas.

Les pages auxquelles vous souhaitez accéder à partir des moteurs de recherche ne doivent pas être bloquées par robots.txt et doivent être incluses dans votre sitemap XML.

Les pages auxquelles vous ne souhaitez pas accéder depuis les moteurs de recherche doivent être bloquées par robots.txt et ne doivent pas être incluses dans votre sitemap XML.

2. Chaque page incluse sera indexée

Vous avez bien lu :

Ce n'est pas parce que vous avez inclus une URL dans votre sitemap qu'elle sera indexée.

Et vice versa, même si vous avez exclu une URL de votre sitemap, les robots des moteurs de recherche peuvent toujours indexer la page.

Les sitemaps XML ne sont qu'une recommandation pour les robots. Il est important de garder à l'esprit que votre site envoie de nombreux autres signaux aux robots d'exploration. Si vous ne voulez vraiment pas qu'une page soit indexée, nous vous recommandons vivement de désactiver le fichier robots.txt.

Le moyen le plus éprouvé de voir quelles pages Google indexe effectivement est probablement d'effectuer un site:search.

Vous pouvez également effectuer une recherche sur une URL spécifique pour voir si elle peut ou non être indexée.

Meilleures pratiques pour les plans de site XML

Nous avons donc une bonne idée de ce qu'est un plan de site XML et nous avons examiné quelques idées fausses courantes sur les plans de site. Plongeons-nous dans les meilleures pratiques.

1. Utilisez un outil pour générer votre sitemap

La première étape pour utiliser correctement les sitemaps est d'en générer un. Malheureusement, ils ne sont pas simplement créés par magie. Vous avez plusieurs options pour le faire :

Yoast SEO

Si votre site Web a été construit sur WordPress, c'est une évidence. Yoast propose un plugin gratuit pour vous aider avec l'optimisation, l'indexation, les canoniques et la génération de sitemap sur la page.

Si vous n'avez pas déjà installé le plugin Yoast SEO sur votre site, voici ce qu'il faut faire :

A. Dans votre tableau de bord d'administration WordPress, accédez à Plugins et cliquez sur "Ajouter un nouveau".

B. Dans la barre de recherche, recherchez "Yoast".

C. Cliquez sur "Installer maintenant", puis sur "Activer".

D. Accédez à [votre-domaine.com]/sitemap.xml. Voilà !

xml-sitemaps.com

C'est un autre excellent outil pour la génération de sitemaps XML, surtout si vous n'utilisez pas WordPress. Voici ce qu'il faut faire :

A. Accédez à xml-sitemaps.com et saisissez votre domaine dans la barre de saisie.

B. Autoriser le site à explorer votre domaine (cela peut prendre environ une minute). Téléchargez votre plan du site.

C. À l'aide d'un FTP ou d'un gestionnaire de fichiers, téléchargez le domaine dans le dossier racine de votre site Web.

Si vous avez un ordinateur Windows, nous vous recommandons Filezilla. Voici quelques instructions pour télécharger des fichiers avec Filezilla. Si vous avez un ordinateur Mac, nous vous recommandons Transmit. Voici quelques instructions pour utiliser Transmit.

2. Soumettre à Google Search Console

Maintenant que vous avez un sitemap, vous vous demandez peut-être quoi en faire .

La première étape consiste à le soumettre à Google Search Console. Cela aidera Google à explorer et à indexer votre site Web, mais comme nous l'avons mentionné, cela ne garantit pas que chaque page incluse sera indexée ou que chaque page exclue sera exclue de l'index.

Voici ce qu'il faut faire :

A. Accédez à Google Search Console et sélectionnez "Commencer maintenant". Si vous avez déjà un compte G Suite, connectez-vous ici. Si ce n'est pas le cas, voici un guide de configuration.

Une fois connecté, vous devriez être redirigé vers un écran qui ressemble à ceci :

B. Entrez votre domaine et cliquez sur "Ajouter une propriété".

Google exige une vérification que vous possédez bien le site. Si vous avez configuré Google Analytics, cela se fera automatiquement pour vous. Sinon, il existe quelques autres options de vérification.

C. Accédez aux plans de site.

D. Insérez l'URL de votre sitemap et cliquez sur "Soumettre".

Et vous êtes prêt ! Donnez à Google le temps de lire le plan du site et revenez régulièrement pour voir si Google a rencontré des erreurs.

3. Prioriser les pages de la plus haute qualité

En ce qui concerne le classement, il semblerait que Google ne considère pas seulement la valeur de la page en question, mais également la qualité globale d'un site Web.

Disons que votre site Web compte 500 pages, mais seulement 10 sont des pages contenant un contenu fantastique qui est utile aux utilisateurs. Les autres sont soit des articles de blog anciens et non pertinents, soit des pages "utilitaires" (connexions, paniers d'achat, endroits pour récupérer les mots de passe perdus, etc.).

Il est très possible que Google considère cela comme un signal que la grande majorité de votre site Web contient un contenu de mauvaise qualité, ce qui nuit à vos chances de bien classer vos pages les plus importantes.

Alors gardez cela à l'esprit lorsque vous décidez quelles pages vous souhaitez inclure dans votre sitemap. Comme nous l'avons mentionné ci-dessus, c'est assez simple:

  • Inclure et indexer les pages que vous souhaitez trouver via les moteurs de recherche
  • Exclure et ne pas indexer les pages que vous ne voudriez pas voir via les moteurs de recherche

4. Utilisez Noindex

En parlant d'inclure et d'exclure des pages, il est vraiment important d'être cohérent. Inclure une page sur votre sitemap tout en demandant aux moteurs de recherche de ne pas l'explorer n'est pas une bonne idée.

Donc, si vous ne voulez pas qu'une page soit incluse dans votre sitemap, laissez-la désactivée et assurez-vous qu'elle n'est pas indexée.

Vous disposez de plusieurs options pour vous assurer que les moteurs de recherche n'explorent pas votre site. Vous pouvez utiliser des méta-robots (instructions dans le <head> d'une page) ou votre fichier robots.txt (un seul fichier contenant les instructions du crawler).

Les méta-robots sont probablement une valeur sûre pour un ancien article de blog ou une page d'utilitaire, tandis qu'un refus de robots.txt aurait plus de sens si vous cherchez à minimiser votre budget de crawl.

5. Tenez compte du budget de crawl

En parlant de votre budget de crawl, il est important de garder cela à l'esprit lorsque vous réfléchissez aux pages à inclure ou à exclure dans votre sitemap XML.

En termes simples, un budget de crawl a à voir avec ce que Google appelle une "limite de taux de crawl". En d'autres termes, les Googlebots ne peuvent pas simplement explorer chaque page du Web à tout moment. Il existe des limites aux serveurs de Google et aux serveurs de votre site.

Si vous avez un très grand site (nous parlons de quelques milliers d'URL), vous devez être beaucoup plus prudent lorsque vous choisissez les pages à inclure que la plupart des sites Web sur le Web qui ont beaucoup moins de pages.

En savoir plus sur les budgets de crawl et les bonnes pratiques directement auprès de Google.

Et voilà, tout ce que vous devez savoir sur les sitemaps XML, comment les générer, les soumettre et les utiliser pour booster votre référencement.

Une fois que vous avez suivi toutes ces étapes, assurez-vous de surveiller de près les performances de votre site Web avec Monitor Backlinks . Il suivra vos mots clés pour vous afin que vous sachiez toujours quelles pages sont explorées et classées sur Google.

Vous pouvez obtenir un essai gratuit de 30 jours ici pour l'essayer.

Maintenant, aidez Google à mieux explorer votre site Web !