Qu’est-ce que le duplicate content

Anglicisme signifiant littéralement contenu dupliqué, le duplicate content est un terme grandement employé dans le référencement et le SEO. Il fait référence au contenu d’un site internet ou d’une page web qui reproduit pratiquement à l’identique celui d’un autre.

Le duplicate content constitue un réel problème dans le référencement, si bien que les moteurs de recherches sanctionnent lourdement ce phénomène.

Qu’est-ce qu’un duplicate content ? Comment les moteurs de recherche traitent le duplicate content ?

Le duplicate content c’est quoi ?

Assimilé à du plagiat ou du copié-collé, le duplicate content peut se présenter comme du contenu textuel simple (composé uniquement de paragraphes) ou un contenu textuel associant plusieurs autres éléments.

Lorsqu’un contenu est entièrement repris pour être publié intégralement ou même avec une légère modification sur une autre adresse URL, il est considéré comme un duplicate content. L’identification des duplicate content se fait par les moteurs de recherche en distinguant deux types de contenu dupliqué.

Premièrement, le duplicate content peut concerner un même site, mais sur des URL différentes. C’est généralement le cas lorsqu’il s’avère nécessaire de faire une version mobile d’un site internet différente de la version desktop. Ce cas peut également survenir à cause d’une erreur technique ou de la volonté du webmaster.

Quelle que soit la raison, les contenus dans les deux pages sont entièrement identiques et l’exemple le plus fréquent est avec les e-boutiques qui présentent les mêmes fiches produits.

Le deuxième cas concerne des pages dupliquées dans deux sites entièrement différents. Dans ce cas, le duplicate content peut résulter de trois situations :

  • une redistribution de flux RSS ;
  • une description identique d’un produit ressemblant ;
  • un plagiat tout simplement.

Les propriétaires de sites web voient le duplicate content d’un très mauvais œil qui, pourtant, peut s’avérer inévitable dans certaines situations. Dans ces cas-là, le contenu source doit être indiqué au robot du moteur de recherche en utilisant la balise rel=canonical. Ainsi, la page considérée comme originale sera indexée.

La sanction d’un duplicate content

Le duplicate content constitue une vraie gêne dans le référencement d’une page par les moteurs de recherche. Il est donc important de souligner qu’en dehors des cas particulièrement graves, les pages présentant un duplicate content seront quand même indexées par les moteurs de recherches. Toutefois, ces derniers ne vont pas surclasser les pages par rapport à un autre site.

Les pages identifiées comme duplicate content perdent leur position dans les SERP. En cas de cas grave, elles sont purement retirées des résultats de recherche. Il existe trois différents traitements de duplicate content par les moteurs de recherche.

  • Lorsque deux contenus sont strictement identiques, la page présentant le meilleur PageRank sera indexée et l’autre ignorée ;
  • Lorsque les contenus sont identiques, mais différenciés par les balises Title et Description, les deux pages seront indexées. Toutefois, celle qui ne sera pas considérée comme originale n’apparaîtra au SERP que si vous cliquez sur « relancer la recherche en incluant les pages ignorées»
  • Lorsque deux pages différentes contiennent des balises Title et Description identiques, le moteur de recherche peut n’indexer aucune d’entre elles, car identifiées comme dupliquées.
scroll to top