Top
google algorithmes

Qu’est-ce que le PageRank ? Tout savoir sur cet algorithme

Le SEO est truffé de terminologies de niche et de concepts complexes. Parmi eux, l’algorithme PageRank de Google est l’un de ces concepts qui fait l’objet de grands débats depuis plus de 20 ans.

Même si vous ne savez pas exactement ce que signifie PageRank, vous avez certainement remarqué que cet algorithme fait fréquemment l’objet de débats entre consultants SEO. Heureusement pour vous, si vous voulez comprendre pleinement ce qu’est le PageRank, comment il fonctionne et comment améliorer le PageRank de votre site, vous êtes au bon endroit !

Qu’est-ce que le PageRank ?

Le PageRank est l’un des nombreux algorithmes de Google, conçu pour évaluer la popularité d’une page web à travers sa qualité et quantité de liens reçus. Le nom PageRank fait référence à Larry Page, l’un des deux co-fondateurs de Google avec Sergey Brin.

L’objectif final est de déterminer la position de votre page web sur la page de résultats des moteurs de recherche (SERP) pour une requête donnée. Plus votre score PageRank est élevé, plus vous avez de chances d’être classé haut pour un mot clé cible donné. Bien que le PageRank ne soit pas le seul facteur de classement pris en compte par Google, il est considéré comme l’un des critères de pertinence les plus importants du processus de classement des sites de Google.

Le PageRank classique

L’algorithme d’analyse des liens est complexe, mais son comportement général est assez simple. Nous allons vous donner un aperçu du fonctionnement de l’algorithme à l’aide de deux sites web hypothétiques que nous appellerons site web A et site web B. Le site web A est un site web d’informations sur le business et les entreprises qui fait autorité, tandis que le site web B est une entreprise émergente de biens de consommation.

Lorsque les robots d’exploration de Google analysent le contenu web sur l’ensemble de l’Internet, ils tombent sur un article récent du site web A. Pendant qu’ils analysent le contenu du nouvel article du site web A, ils recherchent également les liens qui pointent vers d’autres sites Web. Dans ce cas, un lien du site web A pointe vers le site web B.

Les robots d’exploration de Google notent que le site web A est lié au site web B. Lorsqu’ils établissent ce lien, ils identifient également que le site web A – un site web hautement crédible – ne renvoie qu’à d’autres sites web crédibles à travers des hyperliens. Grâce à cette association, Google commence à percevoir le site Web B comme un peu plus digne de confiance qu’il ne l’était plus tôt dans la journée.

👉 Au fur et à mesure que les sites recueillent des liens de sites crédibles, leur score PageRank continue d’augmenter. Cela dit, la qualité est essentielle. Un lien provenant d’un site web de qualité vaut mieux que mille liens provenant d’un site web de faible qualité.

Le PageRank selon Google

Le PageRank n’est pas un terme inventé par l’industrie du référencement. En fait, il est directement mentionné dans la page de philosophie de Google qui a donné naissance à la firme de Mountain View. Voici comment Google décrit le PageRank :

« Nous évaluons l’importance de chaque page web à l’aide de plus de 200 signaux et de diverses techniques, dont notre algorithme PageRank™ breveté, qui analyse les sites qui ont été « votés » comme étant les meilleures sources d’information par d’autres pages sur le Web. À mesure que le Web s’agrandit, cette approche s’améliore car chaque nouveau site est un autre point d’information et un autre vote à comptabiliser. »

Google décrit cela comme une forme de démocratie sur le web. Toutefois, si le PageRank s’apparente à un système de vote, n’oubliez pas que Google n’accorde pas la même valeur aux votes. Un vote du Figaro.fr aura plus d’importance qu’un vote du blog de votre station de radio locale.

Comment Google calcule-t-il le score PageRank ?

Les détails exacts du calcul du PageRank par Google ne sont connus de personne en dehors du siège de Google. Cependant, une chose est sûre : il s’agit d’un algorithme compliqué. Par exemple, voici un extrait du premier brevet PageRank de Google :

« [L’image ci-dessous] montre une relation typique entre trois documents hypertexte A, B et C. Comme le montre cette figure particulière, les premiers liens dans les documents B et C sont des pointeurs vers le document A. Dans ce cas, nous disons que B et C sont des backlinks de A, et que A est un lien sortant de B et de C. Les documents B et C ont également d’autres liens sortants vers des documents qui ne sont pas montrés. »

calcul pagerank

Bien que la formule ait pu changer légèrement au fil des ans, Google a confirmé à travers le podcast ci-dessous que le moteur de recherche utilise une version améliorée de cet algorithme PageRank original.

Après l’exécution de cet algorithme, un site se voit attribuer un score PageRank compris entre 0 et environ 65 000. Bien que Google ne communique pas le score précis d’un site, il a fourni un score simplifié aux utilisateurs PageRank toolbar au début des années 2000.

pagerank-toolbar seo

Le PageRank Toolbar qui communiquait une idée du score de PageRank d’une page web.

Un PageRank de 1 signifiait que vous aviez peu de liens, et que les liens que vous aviez étaient de faible valeur. Un PageRank de 10 signifiait que vous aviez un nombre incroyable de liens de haute qualité pointant vers votre site web. Au début des années 2000, Google présentait ouvertement ce chiffre à tous ceux qui téléchargeaient sa barre d’outils gratuite, afin de les aider à comprendre comment Google évaluait leur site Web.

pagerank explications

Illustration de comment obtenir une bon PageRank sur la toolbar à l’époque. Source : Elliance.com

 

Beaucoup de choses ont changé au cours des 20 dernières années. Même si les sites d’aujourd’hui obtiennent toujours un score PageRank, Google ne fournit plus de score public. Si cela peut sembler frustrant, il y a une raison pour laquelle Google a dû cacher le PageRank derrière une boîte noire. Pour comprendre pourquoi ce changement est intervenu, rappelons brièvement l’histoire du PageRank.

Histoire du PageRank de Google

Même si Google reste discret sur le fonctionnement du PageRank, l’historique de l’algorithme peut nous donner des indications précieuses sur son fonctionnement. Passons en revue les événements les plus marquants de l’histoire du PageRank.

1996 : Les premiers balbutiements

L’histoire de PageRank commence en 1996, lorsque le premier algorithme ressemblant à PageRank est créé. Il est intéressant de noter que cet algorithme n’a pas été créé par Google, mais par un homme du nom de Robin Li, qui travaillait sur un algorithme de notation de sites appelé RankDex. RankDex était utilisé pour noter les sites web en fonction du nombre de liens vers ces sites. Plus votre site avait de liens, plus il était performant.

À peu près à la même époque, deux étudiants en doctorat de l’université de Stanford, Larry Page et Sergey Brin, travaillaient sur un algorithme de recherche pour aider les gens à trouver des informations sur le Web. Ils ont utilisé toutes les informations dont ils disposaient, y compris les recherches de Robin Li pour RankDex.

Deux ans plus tard, Page et Brin avaient fait des progrès significatifs sur leur algorithme de recherche et l’ont breveté sous le nom de PageRank. Et quelques mois plus tard, ce même duo de chercheurs de Stanford fondait Google.

🐼 Vous vous demandez peut-être ce qu’il est advenu de Robin Li et de sa création RankDex pendant tout ce temps. Ne vous inquiétez pas, son travail acharné n’a pas été ignoré. Il a ensuite fondé Baidu, le moteur de recherche le plus populaire en Chine.

2000 : Introduction de la barre d’outils Google

Au début des années 2000, Internet était encore relativement nouveau. En fait, la moitié seulement des ménages américains possédait un ordinateur à cette époque. Mais la popularité d’Internet (et des recherches sur Internet) ne cessait de croître. En 1998, le moteur de recherche Google traitait 10 000 recherches par jour. En 1999, Google traitait plus de 3 millions de recherches par jour. En 2000, Google traitait 42 millions de recherches par jour.

Pour aider ces chercheurs et consolider sa position de leader dans un nouveau secteur en plein essor, Google a lancé la barre d’outils Google. Elle offrait de nombreuses fonctionnalités très utiles pour l’époque, comme la possibilité d’accéder à des signets ou d’effectuer des recherches sur Google sans passer par le site Google.com.

Cependant, elle permettait également aux utilisateurs de vérifier l’autorité d’un site Web qu’ils visitaient grâce à un score PageRank compris entre 1 et 10.

pagerank-toolbar seo

Le Toolbar PageRank qui communiquait le score de PageRank d’une page web.

Dans les années 2000, les entreprises et les amateurs ont commencé à voir l’intérêt de voir leur page apparaître en bonne place sur Google Search. Pour les premiers référenceurs, la feuille de route était claire : Le PageRank influençait le classement de votre site sur Google. Le PageRank était déterminé par le nombre de liens que vous aviez. Et vous pouviez obtenir une mesure simple pour vous aider à suivre avec précision votre score de PageRank grâce à la barre d’outils.

Bien sûr, les gens ont immédiatement commencé à jouer avec le système. À cette époque, les entreprises ont commencé à négocier entre elles pour échanger des liens. Elles achetaient des centaines ou des milliers de liens de mauvaise qualité à partir de « fermes de liens » pour une somme modique. Le référencement clandestin était en plein essor. Google a rapidement compris qu’il devait faire bouger les choses, sous peine d’offrir une mauvaise expérience aux utilisateurs.

2022 : le PageRank thématique ou Topic-Sensitive Pagerank

Les algorithmes des moteurs de recherche étant de mieux en mieux optimisés et le volume des requêtes de recherche augmentant chaque jour, il n’est pas surprenant que la formule du PageRank de Google ait subi d’importantes améliorations au fil des ans. Bien que d’innombrables facteurs soient pris en compte lors du calcul du PageRank aujourd’hui, l’algorithme conserve sa structure la plus fondamentale.

Cependant, un ajout théorique à la formule PageRank qui a fait l’objet d’importantes spéculations est le système Topic-Sensitive PageRank (TSPR). Conçu en 2002 par Taher H. Haveliwala du département d’informatique de Stanford, le TSPR est une proposition de raffinement du PageRank qui calcule plusieurs scores pour une page en fonction de sa pertinence par rapport à des sujets donnés.

👉 En gros, avec le Topic-Sensitive PageRank, la popularité d’une page web dépend de sa relation thématique avec les pages connectées à travers des liens, et pas seulement du nombre de ses liens entrants et sortants.

topic sensitive pagerank

Illustration du Topic-Sensitive PageRank par Moz

À première vue, il est facile de constater les avantages du système Topic-Sensitive PageRank par rapport à l’algorithme PageRank original pour quantifier la pertinence d’une page web par rapport à une requête de recherche. Dans le système TSPR, des pages qui reçoivent beaucoup de liens entrants/backlinks n’ayant pas de rapport avec la thématique du mot-clé visé se verront attribuer un score faible pour ce sujet, tandis que les pages ayant peu de liens entrants, mais provenant de sites traitant d’une même thématique, se verront attribuer un score beaucoup plus élevé.

💡 Par exemple, considérons l’application de la formule originale du PageRank à un site sur les soins aux chiens. La page peut transférer un PageRank élevé à une autre page sur les vacances, qu’elle soit liée ou non par se thématique aux soins des chiens. En revanche, l’application de la formule TSPR à la même page ne transférerait pas autant de PageRank à la page sur les vacances qu’à une page sur la politique des animaux de compagnie d’une compagnie aérienne.

2006 : le nouveau PageRank ?

Le Far West de la manipulation du PageRank ne pouvait pas durer plus longtemps. En 2006, Google a déposé un brevet actualisé (et plus secret) pour une version améliorée de son algorithme PageRank. En outre, un ancien employé de Google a signalé que l’algorithme PageRank original avait été retiré avant la fin de 2006. L’année 2006 a donc été une année importante pour Google et PageRank.

En examinant le nouveau brevet, certaines différences essentielles sont apparues clairement. Certains sites étaient considérés comme « fiables » – le New York Times et l’annuaire Google, par exemple. Lorsque ces sites « de confiance » établissaient un lien avec une page, cette dernière gagnait également en confiance. Ensuite, lorsque cette page était liée à une autre page, elle transmettait une partie de cette crédibilité à l’autre site.

Il était donc beaucoup plus difficile de se livrer à des échanges de liens et à du « link farming », même si ces tactiques « black hat » n’ont jamais vraiment disparu. Pour continuer à lutter contre les pratiques SEO déconseillées, Google a continué à peaufiner cet algorithme PageRank existant tout en ajoutant d’autres capacités à son algorithme, comme RankBrain et Core Web Vitals.

2019 : le brevet original du PageRank expire

Les années entre 2006 et 2019 sont entourées de mystère, Google devenant à juste titre très discret sur ses algorithmes. Cependant, en 2019, le brevet original a expiré sans aucune tentative de renouvellement. Bien que les porte-paroles de Google aient déclaré que l’algorithme original est toujours utilisé, le changement de brevet suggère que l’algorithme original a néanmoins été fortement remanié.

Comment fonctionne l’algorithme PageRank de Google aujourd’hui ?

En 2020, Google a fermement confirmé que le PageRank est toujours important pour l’algorithme de recherche de Google. Bien que Google ne partage toujours pas les détails du fonctionnement du PageRank, les porte-paroles comme John Mueller sont heureux de donner quelques indices pour aider les référenceurs. Par exemple, lors d’une vidéo Google SEO Office Hours en 2021, Mueller a confirmé qu’un bon lien vaut plus que des millions de liens de mauvaise qualité.

💡 N’oubliez pas que si le PageRank est un facteur de classement avéré, il compte davantage pour certaines recherches que pour d’autres. Bien qu’il ne soit pas clair pour quelles requêtes le PageRank est important, il est facile d’imaginer que les sites dispensant des conseils médicaux peuvent avoir besoin d’un score PageRank plus élevé qu’un site web fournissant des conseils commerciaux.

Si l’on regarde l’histoire du PageRank, une chose est claire : son influence sur les SERP a diminué au fil du temps. Aujourd’hui, Google est incroyablement sophistiqué et son objectif est de proposer aux utilisateurs un contenu pertinent et de qualité. Si votre PageRank est un indice de la qualité de votre contenu, Google sait qu’il est loin d’être le seul facteur.

Quels sont les facteurs qui influencent le PageRank ?

Avant d’aborder cette liste, il convient de préciser que nombre de ces facteurs sont spéculatifs. Google est bien conscient que de nombreux référenceurs veulent jouer avec son algorithme, c’est pourquoi il essaie de ne pas partager sa sauce secrète. Cependant, en raison de l’ancienneté et de l’importance du PageRank, les professionnels expérimentés du référencement ont quelques théories sur ce qui fonctionne. Allons-y :

Qualité du site de référence

Cela peut sembler évident, mais la popularité d’un site de référence est le facteur le plus important pour déterminer votre PageRank. La logique veut que les sites de haute qualité préfèrent renvoyer le trafic vers d’autres sites de haute qualité.

Dans le même ordre d’idées, un trop grand nombre de sites de mauvaise qualité peut faire baisser votre PageRank. Ne vous inquiétez pas si vous avez quelques liens spammy pointant vers votre site Web, ou si vous avez naturellement obtenu quelques liens de mauvaise qualité au fil du temps. Google tient compte de ce genre de situations dans son algorithme et simplement les ignorer. Cependant, n’acceptez jamais d’acheter une grande quantité de backlinks à partir d’une source douteuse. Cela nuira à votre PageRank ou, dans le meilleur des cas, n’aura aucun impact sur votre PageRank.

Liens internes

Les liens internes, c’est-à-dire les liens vers le contenu de votre site web sur votre propre site, influencent le PageRank, mais il y a un hic. Les liens internes n’augmentent pas le PageRank global de votre site. Toutefois, selon John Mueller, une bonne structure de liens internes permet de s’assurer que votre score de PageRank est correctement réparti sur l’ensemble de votre site Web. Veillez donc à bien optimiser votre budget de crawl.

Taux de clics et le modèle du surfeur raisonnable

Le taux de clics n’est pas un signal de classement avéré, mais de nombreux référenceurs pensent qu’il pourrait l’être. En effet, l’algorithme PageRank de Google a utilisé par le passé un modèle d’internaute/surfeur raisonnable.

👉 Ce modèle utilise différentes caractéristiques d’un lien sur une page vers une autre page web et analyse les données sur le comportement de l’utilisateur concernant les actions de navigation associées au lien. En gros, ce modèle identifie où l’internaute clic sur la page afin d’attribuer un poids aux liens présents sur la page selon leur emplacement. Par exemple, les liens présents la barre de navigation horizontale et dans le footer auront moins de poids que les liens placés dans le corps du texte en milieu de page.

Bien que Google soit resté silencieux sur le modèle du surfeur raisonnable pendant un certain temps, le brevet ne cesse d’être étendu : Google souhaite donc clairement conserver cette technologie. Sur cette base, il est juste de dire que le comportement d’un utilisateur sur une page qui renvoie vers vous a une certaine importance. Bien qu’il ne soit pas évident de savoir si cela fait référence au taux de clics d’un lien, de nombreux consultants SEO choisissent de l’interpréter de cette façon.

Texte d’ancrage

Le texte d’ancrage, qui est le texte utilisé pour établir un lien hypertexte vers une autre ressource en ligne, n’a pas été confirmé comme influençant votre PageRank. Cependant, il est confirmé que le contexte entourant votre texte d’ancrage est extrêmement précieux pour Google. En outre, les internautes sont plus susceptibles de cliquer sur un lien entouré d’un contenu pertinent et intéressant, ce qui peut entraîner un comportement positif de la part des utilisateurs.

Bien que le texte d’ancrage ne soit pas un facteur de PageRank avéré, l’attention portée à ancre de lien est certainement une bonne pratique SEO. Si vous avez le moindre contrôle sur ce que dit le texte d’ancrage de votre lien, entourez-le d’un texte riche et significatif.

Liens Follow/Nofollow

Ce facteur est souvent cité comme un facteur de PageRank et il a été confirmé que les liens nofollow ne transmettaient pas de PageRank.

Cependant, Google a déclaré en 2019 qu’il considérait désormais les liens nofollow comme un « indice ». Ce qui signifie qu’il peut donc choisir de transmettre le PageRank ou non. Cette décision peut avoir été prise pour réduire une pratique appelée PageRank Sculpting.

Le PageRank a-t-il encore de l’importance pour Google ?

Le PageRank compte toujours dans l’algorithme de recherche global de Google. Toutefois, il ne s’agit pas du seul signal de classement utilisé et, selon la requête, il ne s’agit pas non plus du signal de classement le plus important. Cela a été confirmé dans un tweet de 2020 par John Mueller.

Existe-t-il un moyen de vérifier votre PageRank ?

Malheureusement, Google ne propose pas de méthode permettant de vérifier votre PageRank.

Toutefois, si vous souhaitez obtenir une estimation, il existe quelques outils SEO qui peuvent vous aider. Par exemple, Majestic utilise le Citation Flow pour vous donner un équivalent du PageRank classique et le Trust Flow pour le Topic-Sensitive PageRank (PageRank thématique).

Conclusion

Si le PageRank est toujours utilisé activement par Google, n’oubliez pas que nous avons parcouru un long chemin depuis l’an 2000. Aujourd’hui, Google utilise d’innombrables facteurs de classement en plus du PageRank. Bien que cela puisse rendre la vie un peu plus difficile aux consultants SEO, un algorithme de recherche plus équilibré et plus nuancé est globalement bénéfique pour ses utilisateurs. Au fur et à mesure que le temps passe, nous ne pouvons que prévoir que les algorithmes de Google gagneront en complexité.

5/5 (2 Avis)

Directeur SEO

Je m'appelle Gauthier Caizergues et je travaille dans le domaine du SEO depuis 2010, année durant laquelle j'ai forgé mes connaissances à travers plusieurs expériences entrepreneuriales. En 2014, j'ai intégré La Redoute dans l'équipe SEO de Renaud Joly et Grégory Florin. J'ai ensuite rejoint l'agence de marketing digital Labelium à Montréal, au Canada, où j'ai occupé le poste de directeur SEO pendant 2 ans. C'est à la suite de cette expérience que j'ai co-fondé l'Agence 90 où je suis directeur SEO.

1 Commentaire
  • Olivier S
    28 janvier 2023 at 21 h 19 min

    Excellent article et super fourni ! Le pagerank reste toujours le facteur number 1 pour moi pour développer le SEO de mes sites

Publier un commentaire