Home » Bibliothèque de connaissances » Contenu dupliqué

Contenu dupliqué

juillet 5, 2023
Le contenu dupliqué (duplicate content) est un phénomène assez fréquent sur le web. Celui-ci, bien que courant, peut avoir un impact très négatif sur le référencement d’un site. Dans cet article, découvrez plus en détail ce qu’est le contenu dupliqué, comment le détecter, et comment l’éviter.

Contenu dupliqué : qu’est-ce que c’est ?

On parle de contenu dupliqué ou duplicate content quand des blocs de textes identiques ou très similaires apparaissent à différents endroits, soit sur un seul et même site web, soit sur plusieurs sites web.

On estime qu'environ 30% du contenu en ligne est dupliqué. À première vue, ce chiffre peut sembler important, mais il est en réalité assez logique.

Imaginez deux spécialistes du marketing digital qui tentent d'expliquer ce qu'est le "contenu dupliqué" et ses conséquences. Leurs explications seront forcément très similaires. Et des exemples comme celui-ci, il en existe beaucoup d'autres. C'est un phénomène qui se produit régulièrement sur le web.

Il existe bien sûr des exceptions, comme il existe différents types de contenu dupliqué, certains ayant un impact plus néfaste que d'autres. Nous nous intéressons à cela dans la suite de l'article.

Voici ce dont nous allons vous parler dans cet article :

  • Pourquoi le duplicate content peut nuire à votre site web
  • Les différences entre le contenu dupliqué interne et externe
  • Comment détecter et éviter le contenu dupliqué

Quel est l’impact du contenu dupliqué sur le référencement ?

Le duplicate content peut affecter votre positionnement SEO sur les moteurs de recherche, cela pour plusieurs raisons :

  • Le moteur de recherche ne sait pas quelle page indexer, ou non. Les moteurs de recherche comme Google veulent offrir la meilleure expérience utilisateur possible. En ce sens, ils afficheront rarement deux pages avec un contenu similaire ou identique dans leurs résultats de recherche. Votre page, si elle copie le contenu d'une autre page, pourrait donc ne pas être indexée. 
  • Le moteur de recherche ne sait pas à quelle page attribuer les statistiques. Cela complique l'analyse des performances d'un site web, notamment en termes de trust flow et d'autorité de domaine (domain authority).

Par ailleurs, sachez que si un moteur de recherche ne sait pas quelle est la « bonne » page à indexer parmi plusieurs pages similaires, il choisira généralement celle qui provient du site web avec la plus forte autorité de domaine (domain authority).

Google pénalise-t-il le contenu dupliqué ?

Non, pas nécessairement. Voici ce qu'ils indiquent à ce sujet : « Le contenu dupliqué sur un site n’engendre pas de pénalités, sauf s'il est utilisé pour tromper et manipuler les résultats des moteurs de recherche. »

Autrement dit, le contenu dupliqué n’est pas puni en soi, sauf en cas de fraude manifeste (par exemple, si un site tente de spammer Google en copiant du contenu existant).

Les deux types de contenu dupliqué

Il existe deux types de duplicate content. On vous les présente ci-dessous.

Contenu dupliqué interne

Le duplicate content interne survient lorsqu’un seul et même site web compte plusieurs pages ou plusieurs versions d’une page avec un contenu très similaire. Ce phénomène est souvent dû à des problèmes techniques liés à la structure des URLs. 

Faisons le point sur quelques causes courantes de contenu dupliqué interne.

Variations d’URL presque identiques

Exemple : de nombreuses boutiques en ligne proposent des produits dans différentes couleurs, ce qui entraîne la création de différentes URL avec du duplicate content :

  • exempleboutique.com/tshirts/bleu
  • exempleboutique.com/tshirts/rouge

HTTP /vs/ HTTPS et www. /vs/ sans www.

Certains sites web existent en plusieurs versions avec le même contenu :

  • http://exemple.com et https://exemple.com
  • www.exemple.com et exemple.com

Dans ces cas-là, Google choisit lui-même quelle version de la page indexer. Cela dit, il est difficile pour les robots Google de déterminer eux-mêmes quelle version de la page est « l’originale ». Cela peut résulter à un positionnement de la page assez médiocre.

Il existe des solutions à ce problème, que nous évoquerons plus tard.

Contenu dupliqué externe

Le contenu dupliqué externe survient lorsque plusieurs sites web affichent le même contenu ou des contenus très similaires. 

Un exemple classique est celui du dropshipping :

L'entreprise X achète ses produits auprès d'un fournisseur en Chine. Ce fournisseur vend également à d'autres clients et leur envoie la même description produit. Tous ces clients publient la description fournie sur leur site.

Résultat : Google détecte un contenu identique sur plusieurs sites et a du mal à savoir lequel classer en priorité. C’est un cas typique de contenu dupliqué externe.

Comment vérifier la présence de duplicate content ?

Il existe plusieurs outils pour identifier du contenu dupliqué sur votre site. En voici quelques-uns.

Siteliner

Siteline est un outil gratuit que vous pouvez utiliser pour vérifier la présence - ou non - de contenu dupliqué sur un site ou une page web. Il vous suffit d’entrer l'URL du site ou de la page que vous souhaitez analyser, et vous obtiendrez un rapport détaillé sur la quantité de contenu dupliqué qui y est présente.

Google (navigation privée)

Vous pouvez tester votre site en copiant les 10 à 15 premiers mots d’un texte et en les recherchant sur Google en navigation privée.

Si votre page apparaît en premier, c’est un bon signe. Si ce n’est pas le cas, cela signifie que Google considère un autre site comme étant la source originale.

Copyscape

Avec Copyscape, vous pouvez détecter du contenu dupliqué externe et recevoir des alertes lorsqu’un autre site web copie votre contenu.

Trucs et astuces pour éviter le contenu dupliqué

Vous savez désormais que le duplicate content peut avoir un impact négatif sur le référencement de votre site web. Pour éviter cela, voici quelques conseils.

Optimiser la structure du site

Dans la plupart des cas, une bonne structure de site limite naturellement le risque d’avoir du contenu dupliqué. Aussi, il est important de s’y intéresser et de l’optimiser le plus possible. Vous pourriez avoir de faire quelques corrections, ou peut-être même d’envisager une refonte partielle. 

Cela dit, si votre site dispose d'un nombre de pages important et d'une structure déjà bien établie, un projet de refonte peut être long et difficile. Il ne faut donc pas le prendre à la légère. Vérifiez avant qu’il n’existe pas d’autres solutions à votre disposition.

Créer un contenu unique

Produisez un contenu original et évitez de copier-coller du texte existant. C’est la base pour éviter le duplicate content.

Renforcer l'autorité du domaine

Google accorde plus d’importance aux sites web ayant une forte autorité de domaine. Il les choisira plus facilement comme étant la source originale d’un contenu dupliqué. Cela dit, ce n’est pas le seul élément que prend en compte Google. Il regarde aussi les dates de publication, par exemple.

Mais dans tous les cas, une forte autorité de domaine vous aidera à mieux vous positionner sur Google, notamment face à d'autres sites reprenant votre contenu.

Utiliser la redirection 301

Une redirection 301 permet de rediriger les visiteurs et les moteurs de recherche d’une page dupliquée vers la page principale. Cela permet donc d’envoyer toute la valeur générée par les pages dupliquées vers une seule et même page.

Attention : cela ne fonctionne pas pour les pages qui ont des paramètres d’URL uniques.

Ajouter une balise canonique (canonical tag)

Une balise canonique indique aux moteurs de recherche quelle est la version originale d'une page.

Exemple :

  • Page d’origine : exempleboutique.com/telephones/apple/iphone-12
  • Page en doublon : exempleboutique.com/marques/apple/iphone-12

Solution : ajoutez une balise canonique sur la page dupliquée qui pointe vers la page d’origine.

Attention : même si elle peut aider, une balise canonique n’est pas une garantie absolue que Google suivra votre recommandation et définira la page que vous avez choisie comme « originale ». Mais de façon globale, elle aide quand même beaucoup à réduire les problèmes de contenu dupliqué.

SEO Specialist
Tiemen de Jonge est un spécialiste expérimenté en SEO chez Seeders Zwolle. Avec un Å“il attentif pour les détails et une passion pour l'optimisation de la présence en ligne, Tiemen aide les clients à  améliorer leur classement dans les moteurs de recherche et à  générer du trafic organique vers leurs sites web. Fort de plusieurs années d'expérience dans l'industrie du marketing digital, Tiemen s'engage à  rester à  jour sur les dernières tendances et techniques en matière de SEO pour offrir des résultats de qualité supérieure aux clients de Seeders.
Image