Le duplicate content (contenu dupliqué) désigne le fait de trouver un contenu identique sur différentes pages en interne d’un site ou sur d’autres sites. Ce vol de contenu texte est pénalisable pour Google. Il existe des outils de « Duplicate Content checker » afin de vérifier si un site comporte des pages avec du contenu volé autre part. https://www.copyscape.com/ est très simple, gratuit et utilisable sans inscription. Collez l’adresse du site, l’outil analysera toutes les pages et affichera la liste des pages avec pourcentage de texte dupliqué. Cliquez sur la page pour voir la zone de texte problématique. http://www.siteliner.com/ est également un très bon outil pour analyser le contenu dupliqué sur internet, comme pour Copyscape, indiquez l’adresse du site web pour voir quel texte est plagié.

Duplicate content des balises meta

Sous cette dénomination barbare se cache en fait un processus très simple et bien utile pour tous ceux qui veulent améliorer leurs résultats en termes de sourcing sur internet : il s’agit de sources dont le contenu est tout à fait similaire.

Dans ce cas-là, il est important de comprendre comment fonctionnent les moteurs de recherche. Les navigateurs gèrent le « duplicate content » en appliquant un filtre grâce auquel ils trient les résultats lors des recherches. Dans ce cas de figure, le « duplicate content » s’applique à certaines pages voire à certains sites sur lesquels sont les passages suspects. En revanche, les sites qui contiennent des pages dupliqués à partir d’autres sites ne sont nullement pénalisés.

Si vous êtes suspectés pour « duplicate content », votre page ne sera pas forcément désindexée des moteurs de recherche. Il est possible que les navigateurs le désindexent en cas de plainte selon la législation en oeuvre pour la protection des droits d’auteurs. Cependant, les administrateurs le classeront avec les autres pages desquelles sont tirés les mêmes passages.

Pour l’éviter, il suffit de retenir cette règle simple : il faut impérativement que toutes vos pages soient balisées, « title » et « description » notamment.