Logo Studio Développement Les Vikings Logo Studio Développement Les Vikings
icon-mail icon-phone
  • SEO et performances techniques web et e-commerce
  • Marketech (Marketing & Technique)

Définition : contenu dupliqué et URL canoniques, qu'est ce que c'est et comment les optimiser

Elément d'arrière-plan de site web ou e-commerce permettant l'habillage des pages e-commerce et web sans valeur informative mais nécessaire pour la création de site e-commerce ou web par notre agence web à Lyon Elément d'arrière-plan de site web ou e-commerce permettant l'habillage des pages e-commerce et web sans valeur informative mais nécessaire pour la création de site e-commerce ou web par notre agence web à Lyon Elément d'arrière-plan de site web ou e-commerce permettant l'habillage des pages e-commerce et web sans valeur informative mais nécessaire pour la création de site e-commerce ou web par notre agence web à Lyon Elément d'arrière-plan de site web ou e-commerce permettant l'habillage des pages e-commerce et web sans valeur informative mais nécessaire pour la création de site e-commerce ou web par notre agence web à Lyon Elément d'arrière-plan de site web ou e-commerce permettant l'habillage des pages e-commerce et web sans valeur informative mais nécessaire pour la création de site e-commerce ou web par notre agence web à Lyon Elément d'arrière-plan de site web ou e-commerce permettant l'habillage des pages e-commerce et web sans valeur informative mais nécessaire pour la création de site e-commerce ou web par notre agence web à Lyon Elément d'arrière-plan de site web ou e-commerce permettant l'habillage des pages e-commerce et web sans valeur informative mais nécessaire pour la création de site e-commerce ou web par notre agence web à Lyon Elément d'arrière-plan de site web ou e-commerce permettant l'habillage des pages e-commerce et web sans valeur informative mais nécessaire pour la création de site e-commerce ou web par notre agence web à Lyon Elément d'arrière-plan de site web ou e-commerce permettant l'habillage des pages e-commerce et web sans valeur informative mais nécessaire pour la création de site e-commerce ou web par notre agence web à Lyon Elément d'arrière-plan de site web ou e-commerce permettant l'habillage des pages e-commerce et web sans valeur informative mais nécessaire pour la création de site e-commerce ou web par notre agence web à Lyon Elément d'arrière-plan de site web ou e-commerce permettant l'habillage des pages e-commerce et web sans valeur informative mais nécessaire pour la création de site e-commerce ou web par notre agence web à Lyon Elément d'arrière-plan de site web ou e-commerce permettant l'habillage des pages e-commerce et web sans valeur informative mais nécessaire pour la création de site e-commerce ou web par notre agence web à Lyon
Hébergement
Hébergement
développeur logiciel
devéloppeur front
studio de développement
nouvelles technologies
objets connectés
IoT

Article publié le : 22/09/2023

Picto de lien URL pour définir les URL canoniques à optimiser dans la création de site WordPress par une agence web près de Lyon

Nous allons définir ce qu'est une URL canonique. Donc en préambule, nous allons aborder la question du contenu dupliqué ! Car c'est l'essence de l'utilité d'une URL canonique, éviter que des URL aux contenus analogues ne vous soient préjudiciables.

Au sommaire de cet article :

  1. Qu'est-ce que le contenu dupliqué ?
  2. Pourquoi il est normal d'avoir du contenu dupliqué (pas de panique)
  3. Mais dis-moi Jamy, comment éviter le contenu dupliqué ?
  4. Définition : qu'est-ce qu'une URL canonique ?
  5. Standards, optimisations et erreurs dans les utilisations des URL canoniques
  6. Une conclusion (parce que ça fait toujours bien)

 

1 - Contenu dupliqué : définition

Le contenu dupliqué fait référence à des blocs substantiels de contenu qui apparaissent à la fois sur une ou plusieurs URLs. 
Cela peut être le résultat de la copie de contenu d'un site à un autre, de la pagination, de versions imprimables de pages web, ou d'autres facteurs techniques.
C'est normal d'avoir du contenu dupliqué sur un site, par exemple les paramètres de session, les filtres de produits ou d'autres paramètres d'URL peuvent créer involontairement du contenu dupliqué. Cela peut entraîner une indexation excessive et une dilution de la pertinence.
Il est important de surveiller cela lors de la création ou la refonte de votre site web ou e-commerce.

Premier problème : la dilution de la pertinence

Imaginez que vous ayez plusieurs copies d'une même page sur votre site. Les moteurs de recherche, en tentant d'indexer et de comprendre votre contenu, peuvent se retrouver confus quant à la version à privilégier. Cela peut diluer la pertinence de votre page, réduisant ainsi son potentiel de classement. Une page pertinente en 1ère position vaut mieux que 5 pages pertinentes en 35e position.

En effet, avoir plusieurs versions d'une même page peut entraîner une concurrence interne dans les SERPs. Plutôt que de consolider votre position, vous pourriez vous retrouver à rivaliser avec vous-même pour un rang précieux.

Second problème : problèmes d'autorité de page

Les backlinks sont essentiels pour le SEO. Si différentes versions d'une même page reçoivent des backlinks, l'autorité est répartie entre ces versions plutôt que concentrée sur une seule. Cela réduit l'autorité globale que pourrait avoir une page unique. Voir point précédent.

Troisième problème : des ressources de crawl gaspillées

On n'y pense pas, comme Google est omnipotent et omniscient. Mais les moteurs de recherche ont un budget de crawl. Si les robots passent du temps à explorer et indexer des contenus dupliqués, cela signifie moins de temps pour découvrir de nouvelles pages ou pour revisiter des contenus importants.

Quatrième problème : les sanctions et pénalités

Bien que les moteurs de recherche comprennent que le contenu dupliqué peut être accidentel, des duplications flagrantes, en particulier lorsqu'elles sont le résultat de tentatives de manipulation des classements, peuvent entraîner des sanctions.

 

2 - Pourquoi il est normal d'avoir du contenu dupliqué (pas de panique)

On respire un coup. Pas de panique. Le contenu dupliqué, c'est normal, sans forcément vous en rendre compte.

Par exemple, la compatibilité entre plusieurs types d'appareils :
https://exemple.com/actu/vikings-en-colere
https://m.exemple.com/actu/vikings-en-colere
https://amp.exemple.com/actu/vikings-en-colere

Oui, quand on développe un site internet, on pense à ces choses-là qui ne sont pas forcément visibles !

Autre exemple, créer des URL dynamiques pour des filtres, des paramètres de tri, des pages de recherche ou des identifiants de session : 
https://www.exemple.fr/products?category=casques&color=metal
https://exemple.fr/casques/ceremonie?gclid=ABCD
https://www.exemple.fr/casques/metal/casque-metal.html

Quand un blog va avoir plusieurs URL pour un même article dans plusieurs rubriques :
https://blog.exemple.fr/casques/le-casque-en-metal-accessoire-top-de-2023/
https://blog.exemple.fr/le-metal/le-casque-en-metal-accessoire-top-de-2023/

Les redondances www/non-www, HTTP/HTTPS ou les différents ports (selon configuration du serveur) :
http://exemple.fr/casques/
https://exemple.fr/casques/
https://www.exemple.fr/casques/
https://exemple.fr:80/casques/
 

Ou enfin, la reproduction de contenus sur d'autres sites (syndication notamment) :
https://actu.exemple.fr/mon-petit-casque-du-quotidien-690138.html (article syndiqué) 
https://blog.exemple.fr/les-meilleurs-casques-en-metal/3245/ (article original)

Dans ces cas, le contenu dupliqué est légitime mais n'est pas pour autant à laisser sans URL canonique, pour les raisons que nous venons de voir. Vous ne savez pas traiter ce problème ? Notre agence accompagne les sites e-commerce de nos clients dans ces problématiques - entre autres !
 

3 - Mais dis-moi Jamy, comment éviter le contenu dupliqué ?

Utilisez des balises canoniques: Comme mentionné plus loin, la balise rel="canonical" peut indiquer aux moteurs de recherche votre version préférée d'une page. C'est l'objet de l'article, pas de panique, on en parle après.

Redirections 301: Si vous avez des pages obsolètes avec du contenu similaire, redirigez-les vers les pages pertinentes avec une redirection 301.

Paramètres de recherche Google: Utilisez la Google Search Console pour indiquer comment gérer les paramètres d'URL.

Méta robots noindex: Si vous ne souhaitez pas qu'une page soit indexée, utilisez la balise méta robots avec l'attribut "noindex".

Vous ne savez pas trop comment implémenter cela ? 
Alors il vous faut un accompagnement ou TMA e-commerce, et Les Vikings sont facilement joignables : contactez-nous !

 

4 - Définition : qu'est-ce qu'une URL canonique ?

Lorsque l'on évolue dans le monde du développement web et du SEO, la notion d'URL canonique est incontournable. Mais qu'est-ce qu'une URL canonique exactement ? Et pourquoi est-elle si cruciale pour les moteurs de recherche et l'optimisation de votre site ?

 

1. Définition de l'URL canonique

Une URL canonique est une URL que vous désignez comme la version "préférée" ou "principale" d'une page, parmi plusieurs URLs similaires ou dupliquées. Elle sert à indiquer aux moteurs de recherche quelle version d'une page ils doivent indexer, évitant ainsi les problèmes de contenu dupliqué.

2. Pourquoi utiliser une URL canonique ?

Les moteurs de recherche, tels que Google, détestent le contenu dupliqué. Si plusieurs URLs mènent au même contenu, cela peut diluer la pertinence de la page et entraîner une pénalisation dans les résultats de recherche. L'URL canonique permet d'éviter ce problème en indiquant clairement quelle version de la page est la "source de vérité".

3. Comment fonctionne l'URL canonique ?

L'URL canonique est définie à l'aide de la balise <link rel="canonical"> placée dans l'en-tête <head> de la page HTML. Par exemple :

<link rel="canonical" href="https://www.example.com/page-principale/" />

Extrait de code de balise HTML pour URL canonique dans le cadre d'un accompagnement création de site e-commerce

 

5 - Standards, optimisations et erreurs dans les utilisations des URL canoniques

 

Cas d'utilisation courants

Paramètres de session : Si votre site utilise des paramètres de session dans les URLs, chaque session peut créer une nouvelle URL pour le même contenu.

Pagination : Les sites avec de nombreuses pages (comme les blogs ou les e-commerces) peuvent avoir des contenus similaires sur différentes pages.

Versions mobiles et desktop : Si votre site a des versions distinctes pour mobile et desktop, l'URL canonique peut aider à éviter le contenu dupliqué.

 

Optimisation de l'URL canonique

Consistance : Assurez-vous que l'URL canonique est cohérente sur toutes les versions de la page.

Absolue vs. relative : Il est recommandé d'utiliser une URL canonique absolue pour éviter toute confusion.

Évitez les chaînes : Ne pointez pas une URL canonique vers une autre page qui a également une URL canonique.

Outils et plugins : Des solutions comme Yoast SEO pour WordPress peuvent aider à gérer automatiquement les URLs canoniques.

 

Erreurs courantes

Oublier la balise : Si vous ne spécifiez pas d'URL canonique, les moteurs de recherche devront deviner, ce qui peut entraîner des erreurs d'indexation.

Utiliser des URLs non-canoniques dans le sitemap : Assurez-vous que votre sitemap XML utilise les URLs canoniques.

 

 

6 - Conclusion sur le contenu dupliqué et les URL canoniques

Le contenu dupliqué n'est pas simplement un problème pour les spécialistes du SEO ; c'est un défi technique qui nécessite une compréhension approfondie et une action proactive. En comprenant les implications du contenu dupliqué et en mettant en œuvre des solutions, les développeurs, les experts SEO et les ingénieurs peuvent garantir une performance optimale dans les moteurs de recherche.
L'URL canonique est un outil puissant pour les développeurs, les experts SEO et les gestionnaires de sites internet et sites e-commerce pour gérer et optimiser le contenu dupliqué (en plus des 301, noindex et travail de la Search Console.) 
En comprenant son fonctionnement et en l'implémentant correctement, vous pouvez améliorer significativement le référencement de votre site. Chez Les Vikings, nous sommes développeurs, mais nous comprenons l'importance de la rentabilité et de la performance d'une plateforme web ou e-commerce.

Et gagner plus de thunes (faites-pas l'innocent, on sait pourquoi vous êtes-là.)

Kévin, Directeur associé

co-Gérant chez Vikings Technologies, mon cœur est voué aux paradoxes. Amour de la Technologie et de l'Histoire (de 793 à 1805), passion de la gestion et du potager. Accessoirement, une expérience de plus de 10 ans dans le domaine du numérique. Ce qui implique que j'en sais assez pour reconnaître que j'ai tout à apprendre.