Contenu dupliqué Icône de signet simple

Le contenu dupliqué est un contenu identique ou presque identique qui se trouve dans des URL différentes.

Dernière mise à jour 13 novembre 2023
En-tête de bas de page en dégradé de violet à blanc

La plupart des contenus dupliqués étant involontaires et non plagiés, Google ne les pénalise pas. Cependant, le contenu dupliqué a un impact sur vos efforts d'optimisation des moteurs de recherche (SEO). Poursuivez votre lecture pour connaître la signification et l'impact du contenu dupliqué et savoir comment l'éviter dès maintenant !

Qu'est-ce que le contenu dupliqué dans le cadre du référencement ?

Le contenu dupliqué Il s'agit d'un contenu identique ou presque identique qui se trouve dans des URL différentes. Si une page contient exactement la même copie qu'une autre page, elle est considérée comme du contenu dupliqué. Le contenu dupliqué peut se trouver sur le même site web ou sur des pages de sites web différents.

Google pénalise-t-il le contenu dupliqué ?

Points de vue d'experts Logo Google

"Un contenu dupliqué sur un site ne constitue pas un motif d'action sur ce site, sauf s'il apparaît que l'intention du contenu dupliqué est d'être trompeur et de manipuler les résultats des moteurs de recherche".(Source)

Google

Google ne pénalise pas le contenu dupliqué, du moins lorsqu'il n'est pas intentionnel.

Toutefois, le fait de récupérer délibérément le contenu d'un autre site web et de le republier comme s'il s'agissait du vôtre est déconseillé par les règles de Google en matière de spam(Search Essentials'Spam Policies). Le "scraping" peut avoir pour conséquence que le site soit moins bien classé dans les pages de résultats des moteurs de recherche (SERP) ou qu'il n'apparaisse pas dans les SERP.

Comment le contenu dupliqué se produit-il ?

La plupart des contenus publiés en double ne sont pas intentionnels. En fait, certains propriétaires de sites peuvent ne pas savoir qu'ils ont créé du contenu dupliqué sur leur site !

Voici quatre façons dont le contenu dupliqué se produit sur votre site :

1. Variations d'URL

Votre site peut créer par inadvertance de nouvelles URL lorsqu'il utilise des identifiants de session ou le suivi des clics, de sorte que ce qui était censé être une seule URL peut en avoir plusieurs.

L'existence d'une version imprimable d'une page peut également entraîner un contenu dupliqué lorsque d'autres versions d'une URL sont indexées.

2. Versions du site

Votre site web a-t-il des versions HTTP et HTTPS ? Si c'est le cas, vous avez créé des copies de votre site ou de vos pages. Un site web qui a des versions avec et sans "www" au début peut également avoir créé des copies de ses pages et de son site web.

3. Contenu récupéré

Le scraping consiste à copier du contenu d'une page à une autre. Parfois, cela se fait sans intention de nuire. Par exemple, deux distributeurs différents de la même marque peuvent avoir des pages de produits avec des copies similaires.

4. Duplication coïncidente

Différents sites web peuvent créer et publier des contenus similaires. Les sites d'information couvrent les mêmes événements. Plusieurs distributeurs de la même marque et des mêmes produits peuvent avoir des pages de catégories presque identiques.

Quel est l'impact du contenu dupliqué sur le référencement ?

Bien que Google ne pénalise pas le contenu dupliqué involontairement, le fait d'avoir un contenu ou des pages identiques peut nuire à vos efforts de référencement.

D'une part, la version alternative de votre page peut obtenir plus de liens retour que la version que vous avez optimisée. Par conséquent, la page alternative peut également apparaître dans les SERP.

Le fait d'avoir plusieurs versions d'une page dilue également le jus de lien - au lieu qu'une seule page reçoive tous les liens retour, elle les partage avec les pages dupliquées de votre site.

Le contenu dupliqué peut également empêcher l'indexation des pages nouvellement publiées. Chaque site web dispose d'un budget d'exploration. Au lieu d'explorer et d'indexer vos nouvelles pages, les robots des moteurs de recherche peuvent consacrer plus de temps et de ressources à l'exploration de vos pages dupliquées.

Comment éviter le contenu dupliqué

Maintenant que vous savez ce qu'est le contenu dupliqué et son impact sur le référencement, discutons des meilleures pratiques pour éviter le contenu dupliqué sur votre site :

  • Utiliser des redirections 301
  • Instruire les moteurs de recherche avec des balises canoniques
  • Utiliser une balise meta robots noindex
  • Éviter de publier du contenu dupliqué dans la mesure du possible

Voyons maintenant chaque conseil :

Utiliser des redirections 301

L'utilisation de redirections 301 est un excellent moyen de gérer le contenu dupliqué. Lorsque vous passez d'un site HTTP à un site HTTPS, vous pouvez informer les moteurs de recherche d'aller sur votre page HTTPS au lieu de votre version HTTP en utilisant des redirections 301.

Ainsi, tous les utilisateurs qui ont l'intention de visiter votre page vont sur la version HTTPS même lorsqu'ils essaient de voir la page HTTP.

Les redirections sont également utiles lorsque vous devez fusionner deux ou plusieurs pages et les rediriger vers une seule.

Par exemple, supposons que vous ayez publié un article de blog qui traite d'un sujet sur lequel vous avez déjà écrit. Vous pouvez fusionner le contenu en une seule page, de préférence celle qui est la mieux classée. Vous pouvez ensuite utiliser une redirection 301 vers cette page.

Instruire les moteurs de recherche avec des balises canoniques

Avez-vous une version PDF imprimable d'une de vos pages HTML ?

Vous pouvez indiquer à Google que le PDF est un duplicata et qu'il doit traiter la version HTML comme l'original. Pour ce faire, vous pouvez utiliser la balise canonique dans l'en-tête HTML de la version PDF.

Utiliser la balise meta robots noindex

The meta robots noindex tag is a line of code that you can add in a page’s <head> section to tell search engines to exclude it from the index and SERPs. This code looks like this:

<meta name=”robots” content=”noindex”>

L'utilisation de cette balise exclut votre contenu dupliqué des SERPs et génère du trafic vers les versions de pages que vous optimisez.

Éviter le contenu dupliqué dans la mesure du possible

Si vous remarquez qu'une page particulière génère plusieurs URL pour différentes sessions, regroupez ces URL en une seule.

Vous avez peut-être aussi un blog que vous mettez régulièrement à jour. L'audit régulier de votre site peut vous indiquer des articles de blog traitant de sujets similaires que vous pouvez fusionner en un seul article de blog.

Prévenez le contenu dupliqué et stimulez vos efforts de référencement !

Si vous voulez stimuler vos efforts de référencement et vous classer dans les SERPs, il est important de fournir une expérience utilisateur transparente et un contenu utile. Le contenu dupliqué sur votre site peut nuire à votre classement et perturber vos visiteurs.

Suivez nos bonnes pratiques pour éviter le contenu dupliqué et améliorer votre classement dans les SERPs !

Ne ratez pas le test le plus important de votre site web

Obtenez gratuitement une carte de score SEO de votre site web en moins de 30 secondes.