Pour les besoins de votre visibilité sur les moteurs de recherches (comme Google), un SEO (spécialiste du référencement naturel) aura tendance à vous parler de l’optimisation de votre maillage interne. Mais qu’est-ce que c’est que le maillage interne, comment le travailler et quelle est la logique derrière ce levier onsite des SEO.
Qu’est-ce que c’est que le maillage interne ?
De la structure de site à l’expérience utilisateur :
Dans le maillage interne il y a 2 termes dont le principal est « maillage » : On représente la structure d’un site à travers les liens qui sont faits de page source en page cible comme les mailles d’un filet ou les traits d’une toile d’araignée, et on indique « interne » parce que chaque lien concerné part d’une page de ce site pour arriver sur une autre page du site.
Ces liens servent à faire en sorte que l’utilisateur, ou plutôt le visiteur, découvre au cours de son expérience de visite différentes pages du site web aux travers de ces liens qu’il va utiliser. Je parle ici de visiteur parce que les visiteurs ne sont pas forcément uniquement des humains, il faut aussi prendre en compte les robots de moteurs de recherche ou autres explorateurs comme celui de Google.
Mais un principe essentiel demeure : ces liens internes doivent normalement servir un usage pour un utilisateur qui va s’en servir lors de sa navigation pour arriver, dans le meilleur des cas, au bout d’un acte d’achat, d’inscription, ou la poursuite de la lecture sur votre site.
Ce principe essentiel ne prend malheureusement pas en compte le fait que vous avez besoin que les différentes pages de votre site soient accessibles à ces utilisateurs depuis l’extérieur et afin que des moteurs de recherche comme Google servent ces pages, le robot de Google doit pouvoir passer dessus, et sa méthode d’exploration passant par ces liens (entre autres, mais principalement), vous avez besoin de servir toutes les pages de votre site au travers de votre maillage.
Les robots qui tournent sur le web n’ont néanmoins pas la bande passante (même celui de Google) pour voir l’intégralité de toutes les pages de tous les sites existants (et même s’ils l’avaient, il y aurait un coût important qui dépasse la raison pour un service fonctionnel sans cette exhaustivité). Il leur faut donc une méthode pour prioriser les pages qu’ils vont visiter, Google est parvenu à une méthode mathématique très connue des SEO et qu’ils utilisent très vite : le PageRank (PR), qui va servir de probabilité que la page suivante dans sa liste de pages à visiter soit intéressante.
Mathématiquement, comment représenter ce maillage ?
Ce PageRank, on va pouvoir le calculer au niveau du site en prenant en compte l’intégralité des liens sortants de chaque page qu’on connaît.
Concrètement qu’est-ce que ça veut dire ? Eh bien tout simplement qu’après un crawl avec un outil adapté (screaming frog par exemple), il nous suffit d’exporter la liste des liens sortants (puisque chaque page du site peut avoir des liens vers d’autres pages du site mais ça reste des liens qui « sortent » de la source), et de commencer le calcul du page rank sur cette liste de liens. (Attention, quand on extrait la liste des liens sortants, on garde également dans la liste les liens qui sont fait vers l’extérieur du site, il ne faut pas les filtrer.)
Alors concrètement comment est-ce qu’on va pouvoir faire ? La simulation du PR dépend de ce qu’on appelle un graphe, représenté par des nœuds (nodes) et des lignes (edges).

Représentation d’un site et son maillage interne

: node

: edge
Le PageRank d’une page est la valeur attribuée à cette page à travers les liens qui proviennent d’autres pages. Grâce à ce calcul, nous pouvons évaluer l’importance qu’une page semble avoir du point de vue de ses liens internes.
Il suffit donc de calculer le PR qui nous convient le mieux sur le dataset fourni.
Il peut y avoir plusieurs types de PageRank :
- Le PageRank classique, que tout SEO connaît, qui prends en compte la valeur d’une page source, le nombre de liens sortants de cette page, et qui s’additionne pour la page cible. Ce PageRank est « à l’ancienne », mais reste le plus simple à calculer, via Gephi, ça se fait assez facilement pour ceux qui préfèrent avoir une interface.
- Le PageRank aléatoire raisonnable : en plus du classique, celui-ci va ajouter une dimension d’importance selon la position du lien dans la liste des liens sortants quand on analyse le rendu HTML d’une page. Le premier lien a un facteur poids plus important que les suivants, ce qui amène une opportunité de modification des liens pour améliorer la transmission des liens prioritaires.
- Un PageRank thématisé : en plus du PageRank aléatoire raisonnable, ici, on va s’assurer d’ajouter un nouveau facteur pour le calcul de la transmission, la notion de proximité (l’inverse de la distance) entre le document source et le document cible, qu’on peut calculer avec la distance entre l’embedding du contenu source et l’embedding du contenu cible. Cette version est à mon sens la plus intéressante car elle reste assez facilement activable grâce aux embeddings des LLM (qui sont littéralement les meilleures méthodes d’embeddings disponibles) : on peut se baser sur un LLM comme Ollama pour les embeddings et fournir un calcul de distance assez fiable.
On peut utiliser des formules pour les différents facteurs :
Pour la notion d’aléatoire raisonnable, le poids brut se calcule avec cette formule :

On peut normaliser cette formule pour avoir un résultat de la somme de tous les poids qui soit égal à 1 afin de pouvoir comparer les poids et de distribuer les probabilités correctement :

Où N est le nombre de liens sur la page, P la position du lien dans la liste des liens sortants, W est le poids, J la page source et i la page cible, la formule du PageRank devient donc :

Enfin concernant la notion de PageRank thématisé, il faut ici calculer une proximité via la distance eudlidienne entre deux embeddings. Pour ce facteur, il faut une autre formule :

Ici, e i et e j sont les 2 embeddings dont on identifie l’inverse de la distance. Plus les embeddings sont proches, plus la valeur est proche de 1, plus ils sont distants, plus la valeur est proche de 0.
On peut actualiser la formule du PageRank qu’on peut utiliser :

On ajustera cette formule en ajoutant une pondération de chaque facteurs ajouté (S, w) pour ajuster le poids qu’ils ont.
Et cette formule s’adaptera correctement à des ajustements à faire à posteriori sur des simulations de modifications de liens.

Avec α le poids attribué à l’importance de la similarité et β le poids attribué à l’importance de la position du lien. (Quel poids pour ces valeurs ? à vous de voir ce qui peut sembler logique).
Les libertés de la simulation du PageRank
L’avantage du PageRank, c’est qu’il s’agit d’une formule qu’on peut appliquer à partir d’une liste de liens et quelques informations complémentaires sur les pages qui composent ces liens.
L’inconvénient, c’est que parfois la réalité, liée aux contraintes techniques de certains CMS, fait qu’une stratégie de maillage doit toujours être revérifiée une fois mise en ligne.
(Oui, je pense à un CMS en particulier, et je suis sûr que vous en avez en tête aussi, qui ne permettent pas réellement d’optimiser le maillage).
Cela étant dit, en revenant sur les avantages de la simulation, il faut considérer que ça nous apporte un autre avantage : la possibilité d’automatiser des recommandations.
Dans une stratégie d’optimisation du maillage interne, les possibilités d’optimisations sont nombreuses : nous avons vu qu’il y avait des possibilités d’optimisations via l’usage de la sémantique et de l’emplacement des liens, mais il y a aussi la notion de quantité de liens qui peut varier : on peut décider d’en créer ou d’en supprimer, on en parlera plus tard dans cet article.
Mais avant ça, il faut d’abord envisager la conception des priorités, car chaque acteur peut avoir une notion différente des urls à mettre en avant. Et le maillage interne servant plusieurs objectifs, il faut parfois aider les décideurs à trouver le bon équilibre sur une échelle de choix.
Le curseur de la stratégie du maillage interne
On dit parfois que le maillage interne nécessite de faire des compromis entre intérêt business et « expérience utilisateur ». Il n’y a rien de catégorique en réalité. Dans votre logique de maillage, il est important de mettre en avant des pages stratégiques, tout en évitant de trop pousser les pages non prioritaires. Ça vaut également la plupart du temps pour la logique de navigation pour les utilisateurs, mais on a parfois des surprises.
En premier lieu, l’objectif de toute tentative d’optimisation doit être de pousser les pages avec un intérêt stratégique, que ce soient des pages qui vont amener des utilisateurs à acheter vos produits, à s’abonner à vos newsletters ou à consommer vos contenus d’une façon ou d’une autre selon vos objectifs. Cette notion de priorité varie d’un site à l’autre, nous ne pouvons pas décider à la place du site ce qu’il veut mettre en avant. Parfois même au sein d’une entreprise, plusieurs services peuvent avoir des objectifs différents.
On peut parler des objectifs d’acquisition d’une équipe de création de contenus, qui a pour objectif de légitimer la marque pour des utilisateurs qui viendraient convertir à posteriori, et des objectifs de vente de l’équipe commerciale qui souhaite faire convertir directement.
Ce sont des objectifs qui ne sont pas incompatibles mais qui nécessitent une cohabitation pour pousser de façon équilibrée et suffisante les objectifs de chacun de ces services.
Une fois ma stratégie choisie, qu’est-ce que je fais ?
Quelle forme doit-on adopter pour formuler les priorités ?
C’est assez simple nous avons pour objectif de mettre en avant une liste de pages, celles-ci ont donc pour vocation d’être classées dans un ordre d’importance linéaire.
Quelques approches peuvent vous permettre de faciliter ce classement, en attribuant un montant dépendant du nombre de visites potentielles, ou en fonction du coût général de la page, ou un retour sur investissement espéré, ou un indice de performance clé spécifique à vos intérêts, bref vous avez plein de possibilités pour classer la liste de vos pages. Gardez quand même en tête que certaines pages sont plus difficiles à mettre en avant que d’autres dans l’approche de proximité sémantique.
Prendre en compte la sémantique
En effet la sémantique peut être assez essentielle (on vient de le voir avec la formule du page rank adaptée à sémantique) via la méthode des embeddings. Cette méthode prend la distance entre contenus en compte mais il faut garder en tête que cette notion de distance ne permet pas d’avoir une répartition égale entre chaque lien (c’est d’ailleurs un peu le but), mais ça signifie que certaines pages seront naturellement plus compliquées à pousser, il faudra faire plus d’efforts pour les mettre en avant, car elles sont moins entourées de pages similaires que les autres pages du site.
On peut donc essayer d’optimiser, entre autre, le maillage entre deux contenus en adaptant le texte de ces deux contenus ou en produisant un texte intermédiaire qui va servir à optimiser la transmission entre chaque contenus.
Ici, quelques illustrations sont de rigueur pour intégrer facilement la complexité d’utiliser la sémantique dans le maillage interne :
Prenons la représentation spatiale d’un site avec de nombreuses urls :

Voici donc la représentation, en 2 dimensions, d’un site avec de nombreuses urls (cercles). On peut observer que certaines sont plus proches que d’autres, au point où on peut représenter un cluster de ces contenus sous la forme d’un cercle qui regroupe lesdits contenus

Ici on a un cluster de pages qui ont des sujets très proches. Il est donc facile de faire un maillage entre pages de ce cluster.

Ces pages là en revanche seront plus difficiles à mailler avec les pages du cluster précédent. Mais entre elles, aucun problème.
Maintenant, il faut expliquer également que cette notion de distance, (ajouté à l’amortissement provoqué par le facteur de téléportation) est à l’origine d’un affaiblissement de la transmission du signal global lorsqu’un voisinage par des liens se fait via des pages de plus en plus éloignées.
Le principe, dans ce cas, d’une stratégie de maillage sémantique dans un groupe de page restreint rejoint certaines stratégies appelées « cocons sémantiques », où l’usage de pages intermédiaires proches sémantiquement de plusieurs autres pages permet une meilleure transmission.
Modifier des liens existants : le levier du PageRank aléatoire raisonnable
Une autre technique consiste à uniquement modifier des liens déjà existants afin de faire, à partir du maillage disponible, le meilleur usage de l’existence sans trop toucher, ajouter, ou supprimer de liens.
Comme on l’a vu plus tôt, modifier les liens correspond à changer l’emplacement de ces liens dans la liste des liens sortants d’une page source. Ça correspond globalement à mettre en avant et en premier des liens vers la liste de pages prioritaires, et à descendre dans l’ordre des liens sortants, les liens vers les pages non prioritaires dont le score de PageRank Interne est supérieur aux scores de nos priorités.
Attention néanmoins au nombre de liens sortants : je déconseille de placer un lien au-delà du 100e rang sur une page source, il pourrait ne véritablement plus valoir grand-chose.
Créer ou supprimer des liens en interne : qu’est-ce qu’on doit savoir
Les limites de créer des liens
Dans l’optimisation du maillage interne, la création de liens ne peut pas nous amener toujours à mettre en avant la priorité première de notre liste d’url. Il y a une limite à pouvoir utiliser la création des liens, spécifiquement lorsqu’on veut utiliser les notions de poids intrinsèque à la sémantique et à la position.
Il faut donc parfois se tourner vers d’autres opportunités pour améliorer le score de PageRank interne qu’on peut trouver sur les pages prioritaires, et en particulier relativement aux autres pages du site puisque c’est réellement ce qu’on essaye de faire dans l’optimisation du maillage interne.
Puisqu’on essaye de pousser certaines pages au détriment d’autres, il y a donc plusieurs techniques à essayer :
- Supprimer des liens vers les pages non prioritaires
- Ajouter des liens vers les pages prioritaires et leurs parentes
- Modifier les liens vers les pages prioritaires pour faire en sorte qu’elles apparaissent toujours en haut
- Obfusquer certains liens peut être encore utile si on ne considère que le rendu HTML (ce qui est plus simple dans un premier temps)
L’avantage contre intuitif de supprimer des liens
L’une de ces autres opportunités c’est d’essayer de faire en sorte de retirer des liens qui sont faits vers des pages qui seront non prioritaires de sorte qu’on peut réussir à mieux distribuer le PageRank vers les pages réellement importantes.
La recommandation est donc assez simple, pour pousser certaines pages, il faut dé prioriser certaines autres.
Un bon schéma sera mieux qu’un long discours, on va représenter le maillage au sein d’un site comme j’ai l’habitude de le faire.

Ici notre page Prioritaire devrait recevoir plus de PageRank que la page Top ou la page « concurrente » (Competing).
Que faire ? Supprimer le lien de Top vers Competing devrait suffire à améliorer la force relative de Prio par rapport au reste des urls. Supprimer le lien de Prio vers Top n’a pas un énorme impact, si ce n’est pour réduire l’importance de Top.
Pour autant, est-ce qu’on doit supprimer les liens sortants des pages prioritaires ?
NON ! Ces liens sortants permettent la transmission du PageRank au sein du site. Vous pouvez réduire le nombre de liens sortants et choisir spécifiquement des pages qui vont permettre au PageRank de revenir sur la page prioritaire, mais supprimer tous les liens sortants fera plus de mal à votre site globalement que de bien à vos urls prioritaires.
Certains liens que je veux supprimer ont pourtant un intérêt pour les interactions utilisateurs, que faire ?
Plusieurs possibilités :
- Ce ne sont pas des liens à supprimer parce que les urls qu’ils servent sont réellement dans vos priorités.
- Ce sont des liens qui servent les priorités d’un autre, et vous pouvez souhaiter les faire « disparaître » du maillage via l’obfuscation.
Un point rapide sur l’obfuscation de lien
Enfin, concentrons-nous sur l’obfuscation des liens, cette technique subtile qui consiste à modifier le rendu HTML de certains liens afin de réduire leur impact dans la transmission du PageRank, sans pour autant les supprimer et compromettre l’expérience utilisateur.
Au lieu de retirer un lien qui, par son utilité pour la navigation ou l’interaction, mérite de rester visible pour vos visiteurs, on peut « masquer » sa valeur aux robots des moteurs de recherche.
Concrètement, cela pouvait se traduire par des modifications via JavaScript qui rendent le lien moins « lourd » en termes de transmission d’autorité, ou par du cloaking côté serveur (par détection de l’agent) de la partie « lien ».
L’objectif est double : d’une part, préserver la fluidité de la navigation et la pertinence de l’interface utilisateur, et d’autre part, affiner la distribution du PageRank en redirigeant la puissance des signaux vers les pages véritablement prioritaires.
Du point de vue d’un moteur de recherche classique qui utilise les liens HTML, ces liens sont invisibles et ne servent pas le graphe du web. En revanche du point de vue d’un moteur qui va faire du rendu javascript, les liens obfusqués en javascript sont parfaitement lisibles.
Une technique plus simple consiste à faire référence à un code javascript qu’on met incidemment dans un fichier non accessible par les robots.
Autre possibilité, se servir des boutons au lieu des liens pour faire un lien non suivi, mais attention, si dans le HTML vous avez une chaîne de caractères qui ressemble à un lien, il y a des chances que le Googlebot essaye d’y accéder quand même.
Attention aux techniques de cloaking et d’obfuscation en général, servir un contenu différent aux robots et aux humains est assez mal vu même si en réalité, il n’y a sans doute pas une grande campagne contre cette technique, c’est quelque chose qui peut arriver.
Globalement, l’obfuscation des liens est une technique qui peut pleinement s’envisager mais dont la durabilité est incertaine sur le long terme.
Les lignes de conduite à respecter
On a vu toutes sortes de techniques pour améliorer le maillage en interne d’un site et optimiser le page rank interne il y a donc la modification des liens l’ajout de liens vers les pages prioritaires et la suppression de liens vers les pages non prioritaires.
Il y a 2 grands gardes fous à conserver lorsqu’on considère le nombre de liens qui sortent et le nombre de liens qui rentrent vers chaque page. On ne devrait pas avoir plus d’une centaine de liens sortants. Google indique « permettre » jusqu’à 200 liens et au-delà de 300 liens il n’y a plus de transmission de PageRank, mais en réalité, en interne d’un site, une centaine de liens sortants suffisent largement.
Du point de vue du nombre de liens entrants il y a un minimum à respecter il faut au moins un lien entrant par url du site, et que toutes les urls soient accessible depuis la home, directement ou indirectement.
En conclusion, le maillage interne est une stratégie intéressante pour optimiser la répartition du PR à des fins d’optimisation du référencement naturel de certaines urls d’un site web. Il consiste à créer des liens internes entre les différentes pages du site, afin d’améliorer leur visibilité sur les moteurs de recherche comme Google. Cette stratégie va généralement de pair avec un travail sur l’expérience utilisateur pour faciliter la navigation de ce dernier à travers les contenus du site.
Lors de la mise en place d’une stratégie de maillage interne, prenez en compte l’usage d’une sémantique pertinente pour chaque lien, et l’emplacement optimal de ces liens sur les pages source. Une stratégie de maillage interne bien pensée, basée sur une analyse régulière des performances des pages et une adaptation continue en fonction des impératifs business de votre site, aura un impact durable sur vos performances.
Remerciements :
Thomas Largillier & Sylvain Peyronnet : Conseils algorithmiques & mathématiques
Guillaume Peyronnet : Conseils techniques
Lucie Cazenave – Peyronnet : Conseils d’écriture