Pagination et SEO : éviter les pièges
En résumé
La pagination crée des pages supplémentaires qui consomment le budget de crawl et diluent l'autorité entre des URLs peu stratégiques. La solution standard est de rendre chaque page paginée indexable avec un contenu propre, des links canonicals auto-référentiels, et d'utiliser des signaux de pagination explicites pour Googlebot.
La pagination est inévitable sur les blogs, les catalogues e-commerce et les résultats de recherche interne. Mal gérée, elle produit des dizaines de pages quasi-identiques qui affaiblissent vos pages réellement stratégiques.
Les problèmes SEO spécifiques à la pagination
La première page d'une liste (page 1) concentre généralement les backlinks et l'autorité. Les pages 2, 3, 4... reçoivent peu ou pas de liens et diluent le budget de crawl sans apporter de valeur autonome.
Le contenu des métadonnées (title, description) est souvent dupliqué entre les pages paginées, ce qui empêche Google de les distinguer et entraîne une canonicalisation incorrecte.
Solutions techniques recommandées
Depuis la suppression des balises rel=prev/next par Google en 2019, il n'existe plus d'attribut HTML officiel pour signaler la pagination. Google détecte la structure de pagination par le contenu et les conventions d'URL.
La meilleure pratique actuelle est d'utiliser des canonicals auto-référentiels sur chaque page paginée (/page/2 pointe vers elle-même), un title unique par page (par exemple « Articles de blog — Page 2 sur 12 »), et des liens de navigation clairs.
- Title unique par page paginée avec numéro de page explicite.
- Canonical auto-référentiel sur chaque page paginée (pas de canonical vers la page 1).
- Liens de navigation en HTML pur, pas en JavaScript dynamique.
- Exclure les pages de pagination profondes (page 50+) via robots.txt si elles n'ont aucune valeur.
Le « load more » et le scroll infini : impact SEO
Les interfaces « Charger plus » et le scroll infini sont populaires en UX mobile mais invisibles pour Googlebot si le contenu est chargé via JavaScript sans URL distincte. Googlebot ne scroll pas et ne clique pas sur les boutons.
Si vous utilisez ces patterns, implémentez une version de pagination HTML classique en parallèle, ou utilisez l'intersection observer avec des URLs de fallback accessibles sans JavaScript.
Sur les sites e-commerce utilisant le scroll infini sans fallback HTML, entre 30 et 70 % des produits au-delà de la première « vue » ne sont jamais indexés par Google.
Cas particulier : la page de catégorie e-commerce
Les pages de catégorie page 1 doivent concentrer le contenu éditorial (description de la catégorie, mise en avant des produits vedettes) pour cumuler autorité et pertinence thématique.
Évitez d'indexer les pages de tri (tri par prix croissant, tri par popularité) qui génèrent des dizaines d'URLs pour un contenu identique. Utilisez robots.txt ou des balises noindex pour les exclure.
Questions fréquentes
Faut-il mettre en noindex les pages de pagination au-delà de la page 1 ?
Non en règle générale. Les pages paginées avec des produits ou articles uniques méritent d'être indexées. Le noindex prive Google de l'accès à des contenus réels et peut faire disparaître des produits importants des résultats.
Est-ce que canonical de la page 2 vers la page 1 est une bonne pratique ?
Non. Si la page 2 liste des contenus différents de la page 1, une canonical vers la page 1 indique à Google que les deux pages sont identiques, ce qui entraîne la désindexation de la page 2. Utilisez un canonical auto-référentiel.
Google peut-il indexer les pages profondes d'une pagination ?
Oui, si les liens de navigation sont en HTML et accessibles. La page 20 d'un blog peut être indexée si elle est accessible depuis les liens de pagination. La contrainte est le budget de crawl : les très grandes paginations sont crawltées moins fréquemment.
Envie d'appliquer tout ça à votre site ?
Réservez un audit offert — sans engagement.