Comment trouver un Sitemap ?

par | 8 Juin 2020 | Guides SEO, SEO

Les Sitemaps représentent un fondamental d’un site web sain et compatible avec les robots des moteurs de recherche. Bien qu’ils ne soient pas obligatoires, ils peuvent aider à garantir que Google et les autres moteurs découvrent toutes vos URL facilement. Ils sont particulièrement utiles si la hiérarchie de votre site ou votre maillage interne ne sont pas clairs et optimisés pour la navigation.

💡 Qu’est-ce qu’un Sitemap ?

Un Sitemap est un fichier qui rassemble et liste des pages indexables d’un site web. Le type de Sitemap le plus courant auquel on se réfère généralement dans le cadre du SEO est au format XML afin d’aider les robots d’exploration des moteurs de recherche à trouver toutes les URL d’un domaine. Les sitemaps HTML peuvent également exister sous forme de pages HTML et visent généralement à aider les utilisateurs humains en fournissant une liste de pages auxquelles ils peuvent accéder à partir d’un seul endroit.

sitemap-meme

⚙️ Quels sont les différents formats de Sitemaps ?

L’autorité principale chargée de régir la norme pour les Sitemaps est sitemaps.org. Il existe différents types de formats de sitemaps pris en charge par Google :

  • XML
  • RSS, mRSS, et Atom 1.0
  • Text
  • Google Sites
  • HTML

De nombreuses extensions sont disponibles pour vous aider à fournir des informations supplémentaires sur le contenu de votre fichier Sitemap. Ainsi, vous pouvez créer des Sitemaps spécifiques pour vos :

  • Images
  • Vidéos
  • Actualités

En plus des Sitemaps archivant vos URL, vous pouvez également créer un fichier d’index de Sitemap qui, si vous avez plusieurs Sitemaps, vous permettra de regrouper ces derniers et des les afficher clairement dans cet index pour les crawlers des moteurs de recherche. En incluant des liens vers vos fichiers Sitemaps dans un index, vous pouvez organiser vos URL de manière hiérarchique par section de site ou inclure plus que la limite de 50 000 URL par Sitemap requise par Google.

➡️ Exemple concret

Prenons un exemple concret. Le fichier Sitemap du e-commerce de La Redoute est accessible via cette adresse : https://www.laredoute.fr/sitemap.xml

Comme vous pourrez le constater, en raison du grand nombres de pages sur le site, le célèbre e-commerce a décidé de construire un index des Sitemaps. Cet index regroupe les URLs menant aux fichiers Sitemaps spécialement créés pour différents groupes de pages : articles de blog (sitemap-blog.xml), pages dédiées aux marques vendues sur le site (sitemap-brand-pages.xml), pages catégories (sitemap-categories.xml) etc…

exemple-index-sitemap-redoute

 

⭐ Quel est l’intérêt à trouver un Sitemap ?

Voici quelques-unes des raisons courantes pour lesquelles il est utile de localiser un Sitemap :

  • Trouver d’anciens Sitemaps sur votre domaine qui pourraient être obsolètes.
  • Obtenir une liste de toutes les pages d’un site web.
  • Analyser la concurrence (voir comment les concurrents structurent leurs index de Sitemaps ou leurs répertoires de sites).
  • Trouvez l’URL de Sitemap à soumettre aux crawlers (surtout si votre Sitemap est généré automatiquement par un CMS).

Comment trouver un Sitemap ?

Vérifiez les emplacements communs

Le fichier sitemap.xml est généralement situé dans le répertoire racine de votre domaine (ex : https://www.votredomaine.fr/sitemap.xml). Le nom du fichier peut être défini librement par le webmaster. Ce fichier peut vivre n’importe où du moment qu’il est accessible aux internautes sur le domaine du site web. Il peut être placé dans un sous-répertoire, ce qui est parfois fait pour cacher un Sitemap aux concurrents qui cherchent un moyen facile de découvrir toutes les URL du domaine.

S’il s’agit de votre domaine, vous pouvez accéder au répertoire des fichiers de votre site web par FTP pour voir où se trouve le fichier XML du Sitemap.

👉 Si vous n’avez pas accès aux fichiers de votre site directement, vous pouvez essayer de taper quelques formes d’URLs courantes pour les Sitemaps dans votre navigateur pour voir s’il y a des fichiers actifs auxquels vous pouvez accéder. Par exemple :

https://www.votredomaine.fr/sitemap.xml
https://www.votredomaine.fr/sitemap_index.xml
https://www.votredomaine.fr/sitemap1.xml

Vérifiez votre fichier Robots.txt

Tous les sites web devraient avoir un fichier robots.txt pour fournir des directives aux robots d’exploration. Ce fichier comprend généralement un lien vers le Sitemap pour aider les moteurs de recherche à localiser rapidement le fichier pour commencer l’exploration. L’emplacement standard du fichier robots.txt se trouve directement sous le répertoire principal du site, c’est-à-dire : https://www.votredomaine.fr/robots.txt

Vous pouvez essayer cela pour n’importe quel domaine et si un Sitemap est déclaré, vous verrez une entrée de ligne telle que :

Sitemap : https://www.votredomaine.fr/sitemap.xml

C’est le cas pour le site de La Redoute :

sitemap-robots-redoute

Utilisez les opérateurs de recherche de Google

Il existe un certain nombre commandes de recherche avancées qui peuvent aider à affiner une recherche dans Google. Si un Sitemap existe sur un domaine qui n’est pas à l’emplacement standard ou déclaré dans le fichier robots.txt, c’est votre meilleure chance de trouver les Sitemaps que Google a découverts et indexés.

Il existe deux façons de rechercher des Sitemaps XML sur un domaine, toutes deux utilisant la commande « site: » suivie de votre nom de domaine, puis du type de fichier XML à identifier. Essayez de taper l’une de ces commandes dans Google pour voir si des résultats sont obtenus :

site:votredomaine.fr filetype:xml

OU

site:votredomaine.fr ext:xml

commande-cdiscount-sitemap

 

💡 Si la recherche renvoie de nombreuses pages de fichiers non pertinentes, vous pouvez la préciser en ajoutant des informations supplémentaires :

 

site:votredomaine.fr filetype:xml inurl:sitemap

OU

site:votredomaine.fr ext:xml inurl:sitemap

Ainsi, Google recherchera les fichiers XML de votre domaine dont le nom de fichier ou le sous-répertoire contient le mot « sitemap ».

Utilisez la Search Console

Si vous êtes propriétaire du site web en question et qu’il y a déjà une propriété Search Console créée pour le site, connectez-vous pour voir si un Sitemap est soumis que Google est déjà en train d’explorer.

ex-sitemap-search-console-agence-90

 

Vérifiez votre CMS

Si vous utilisez un CMS commun, il est possible qu’il génère automatiquement un Sitemap pour vous. Consultez la documentation dépendant de votre CMS pour voir s’il y a des détails sur les Sitemaps. Nous avons inclus ci-dessous des informations sur les CMS les plus utilisés :

👍 Comment trouver votre sitemap sur WordPress ?

WordPress n’a pas de fonctionnalité intégrée pour la génération automatique de Sitemaps mais il existe de nombreux plugins qui offrent cette fonctionnalité. Les extensions les plus courantes sont Yoast SEO et Google XML Sitemaps.

🤔 Comment trouver votre Sitemap sur Shopify ou Wix ?

Ces deux plateformes génèrent automatiquement des Sitemaps XML et les placent sous forme de fichier sitemap.xml sur votre domaine. Vous devriez pouvoir trouver votre Sitemap en ajoutant /sitemap.xml à la fin de votre domaine dans votre navigateur. Exemple : https://www.votredomaine.fr/sitemap.xml

Bien que ces services ne vous permettent pas de modifier directement les fichiers Sitemaps, ils se mettent automatiquement à jour avec les nouvelles URL lors de leur création, à moins que vous ne spécifiiez explicitement dans le CMS que certaines URL doivent être exclues du Sitemap.

J’ai trouvé mon Sitemap. Et après ?

Une fois que vous avez identifié ou créé votre Sitemap vous devez vérifier que le fichier est valide. Pour ce faire, vous pouvez soumettre son adresse dans la Search Console ou utiliser un outil tel que ce validateur de Sitemap. Si vous disposez d’un fichier de Sitemap valide, suivez les étapes suivantes pour obtenir le meilleur impact possible sur votre référencement :

  1. Assurez-vous que votre Sitemap est à jour et que les URL sont valides : en plus d’un format de fichier valide, votre Sitemap ne doit contenir que des URL précises qui existent et dont la réponse renvoyée par le serveur correspond au code 200. Tout Sitemap obsolète ou incorrect doit être supprimé afin d’éviter toute confusion pour les robots.
  2. Ajoutez une ligne pour déclarer votre Sitemap dans votre fichier robots.txt (facultatif) : c’est une bonne idée pour les autres moteurs de recherche qui ne sont pas Google ou Bing, mais si vous êtes sensible au fait que des concurrents obtiennent des informations précieuses par le biais de votre Sitemap, cela n’est pas nécessaire.
  3. Soumettez votre Sitemap à Google via la Search Console : la Search Console fournit des informations précieuses sur la façon dont Google traite votre fichier Sitemap.
  4. Soumettez votre Sitemap à Bing via Bing Webmaster Tools (l’équivalent de la Search Console pour Bing) : Bing fournit également un outil pour la soumission de votre Sitemap.

Et si je n’arrive pas à trouver mon Sitemap ?

Si vous avez essayé toutes ces méthodes et que vous ne trouvez toujours pas votre Sitemap, il est possible que vous n’en ayez tout simplement pas. Pour créer un Sitemap, vous pouvez utiliser un plugin sur votre CMS (comme expliqué dans cet article), en créer un manuellement ou utiliser un crawler tel que Screaming Frog pour explorer votre site et exporter un fichier Sitemap que vous pourrez télécharger.

Pour plus d’informations sur les Sitemaps, consultez la section d’aide Search Console fournie par Google.

0 commentaires

Soumettre un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Catégories

Podcasts

A Propos

Nous sommes une agence de Marketing Digital experts SEO, SEA, Amazon et Social Media. Retrouvez au sein de notre notre blog toutes les dernières informations concernant l’univers du marketing digital et nos astuces pour mener votre propre stratégie de Référencement Naturel, et Publicité Amazon, sur Google et les Réseaux Sociaux.

Les incontournables

Obtenir un bon backlink en SEO

Histoire des réseaux sociaux

Comment trouver un sitemap ?

Qu’est-ce que le CPC ?

Stratégie Google Ads

Budget Facebook Ads

Balise titre SEO

Pourquoi mon site n’apparait pas sur Google ?

Audience Google Ads

Tout savoir sur le cache Google

TOP 10 des extensions WordPress pour la vitesse de votre site

Quand poster sur Instagram ?

Badge de protection Google

Tout connaître sur le contenu dupliqué

Qu’est-ce que le SEO ?

ACos Amazon

Choisir son consultant Google Ads

Amazon Brand Registry

Comment créer des campagnes Performance Max ?

5 façons d’optimiser votre temps de chargement

Tout savoir sur le balise canonique

Intention de recherche en SEO

Comment savoir si un compte Instagram a de faux followers ?

Quand publier sur Facebook ?

Amazon Explore

Les mots en gras sont-ils importants pour le SEO ?

Les liens sortants sont-ils importants en SEO ?

Qu’est-ce IndexNow ?

Guide des campagnes Google Ads

Quand publier sur LinkedIn ?

Les choses à surveiller avant d’ajouter un disallow au robots.txt

Comment fonctionne un moteur de recherche ?

Qu’est-ce que AMP ?

Définition du PageRank

Contenu caché et SEO

Les défis du SEO

Google Ads : clics vs. impressions

Que veut dire hashtag ?

Comment devenir un vendeur rentable sur Amazon ?

Qu’est-ce que Google Discover ?

Quand publier sur Twitter ?

Définition de l’E-E-A-T

Yandex n’est pas le moteur de recherche numéro 1 en Russie

Amazon Seller Central vs. Vendor Central

Conseils Google Performance Max

Amazon Vine

Créer une fiche d’établissement Google

Générateur de balises Schema

Expression exacte en Google Ads

Comment calculer un taux de conversion ?

Le negative SEO

Redirection 301 vs. 302

Tout savoir le nofollow

Comment obtenir le badge Instagram ?

Le nombre de mots est-il important en SEO ?

Comment connaître le nombre de pages d’un site ?

Les meilleurs outils SEO

Les facteurs de ranking de Yandex