Contenu dupliqué et balise canonical
En résumé
Le contenu dupliqué dilue l'autorité entre plusieurs URLs et perturbe le choix de Google pour la page à afficher. La balise canonical indique quelle version est la référence. Utilisez-la systématiquement sur vos URLs paramétriques, paginées et les versions HTTP/HTTPS ou www/sans-www.
La duplication de contenu n'est pas une pénalité en soi, mais elle oblige Google à choisir seul quelle version indexer — et il ne choisit pas toujours celle que vous voulez. La balise canonical vous rend ce contrôle.
Les sources de duplication les plus fréquentes
La majorité du contenu dupliqué est technique, non intentionnelle. Les sites e-commerce sont particulièrement exposés : filtres de tri, paramètres de pagination, variantes de produits et URLs de session génèrent des dizaines de versions identiques d'une même page.
La syndication de contenu, la reprise d'articles sur plusieurs domaines et les versions imprimables de pages sont des sources de duplication externe souvent oubliées lors des audits.
- URLs avec et sans www (exemple.fr vs www.exemple.fr).
- Versions HTTP et HTTPS non redirigées.
- Paramètres de tri et filtres dans les URLs e-commerce.
- Pages de pagination (/page/2, /page/3) avec contenu similaire.
- Fiches produits accessibles via plusieurs catégories.
La balise canonical : syntaxe et usage
La balise canonical se place dans le head de la page non canonique et pointe vers l'URL de référence. Elle peut pointer vers soi-même (auto-référentielle) sur les pages principales — une bonne pratique recommandée par Google.
Une canonical auto-référentielle sur chaque page confirme à Google votre intention et évite qu'une URL parasite prenne le dessus si quelqu'un crée un lien vers une version alternative.
- Canonical inter-domaines : pour indiquer la source originale d'un contenu syndiqué.
- Canonical sur les pages AMP : pointer vers la version standard non-AMP.
- Canonical sur les pages de pagination : pointer vers la page principale de la série.
- Ne jamais chaîner les canonicals (A pointe vers B qui pointe vers C) : Google ignore souvent les chaînes.
Canonical vs redirection 301 : quand choisir quoi
La redirection 301 est plus forte que la canonical car elle élimine l'URL alternative au niveau serveur. Si deux URLs sont absolument identiques et qu'une est inutile, préférez la redirection.
La canonical est préférable quand vous devez conserver les deux URLs accessibles pour des raisons techniques ou fonctionnelles — par exemple, une page imprimable ou une version mobile conservée pour une campagne spécifique.
Sur les sites e-commerce de taille moyenne, entre 10 et 35 % des pages indexées sont des doublons techniques résolus par une combinaison de canonicals et de règles robots.txt.
Questions fréquentes
Google respecte-t-il toujours la balise canonical ?
La canonical est un signal, pas une directive. Google la suit dans la grande majorité des cas, mais peut la contourner s'il juge que la page pointée est moins pertinente que la version actuelle. Des signaux contradictoires (liens internes vers la mauvaise version, sitemap incluant la version dupliquée) réduisent son efficacité.
Le contenu dupliqué entraîne-t-il une pénalité Google ?
Non, sauf en cas de contenu copié délibérément pour manipuler les résultats. La duplication technique ou accidentelle ne déclenche pas de pénalité mais dilue votre autorité et peut entraîner le choix de la mauvaise version canonique.
Comment détecter le contenu dupliqué sur mon site ?
Screaming Frog avec le mode de comparaison de hash de contenu est l'outil le plus efficace pour la duplication interne. Pour la duplication externe, Copyscape ou Siteliner permettent de détecter les reprises de vos textes sur d'autres domaines.
Envie d'appliquer tout ça à votre site ?
Réservez un audit offert — sans engagement.