Quelques heures après avoir publié mes bonnes pratiques en Marketing de Contenu, Laurent m’envoya un bref message sur Skype :
Dis-moi, avant de le publier, as-tu bien vérifié le Duplicate Content dans ton guide pour les entrepreneurs ?
J’avais vaguement entendu parler des contraintes du contenu dupliqué auparavant.
Mais je ne pensais pas que ça allait me concerner un jour.
En effet, je ne fais que coucher sur papier tout ce qui me passe par la tête dès que je découvre un sujet qui est susceptible de vous intéresser sur le Marketing Digital.
Je lui demande alors si c’est bien nécessaire puisque je suis certaine de mon intégrité et de ma bonne foi en écrivant mon article.
Sa réponse a été très claire :
Rassure-toi, je sais que tu rédiges de beaux articles sans tenter de copier qui que ce soit. Toutefois, le web n’en est pas aussi certain. D’ailleurs, il suffit de quelques similitudes d’expressions ou de phrases pour que ton contenu soit déclaré comme dupliqué. Renseigne-toi, car cela perturbe Google et les autres moteurs de recherche.
Comme à mon habitude, je me suis empressée sur Google pour en savoir plus sur le “Duplicate Content” ou contenu dupliqué.
Table des matières
Le Contenu Dupliqué, c’est quoi ?
Votre contenu est qualifié de « dupliqué » lorsqu’il présente trop de ressemblances avec celui d’un autre auteur.
Attention, le contenu dit « dupliqué » peut concerner un article dans son ensemble (on parle alors de plagiat) ou juste une partie.
Voilà comme Google présente le contenu dupliqué :
Un contenu en double est généralement des blocs de contenu importants, appartenant à un même domaine ou répartis sur plusieurs domaines, qui sont identiques ou sensiblement similaires.
Ainsi, il suffit d’une citation, phrase ou liste pour que votre contenu ne soit pas unique.
Quel est le problème ?
Un contenu dupliqué a des effets négatifs sur le classement des moteurs de recherche.
En effet, lorsque Google détecte plusieurs éléments de contenu « sensiblement similaires », il a des difficultés à déterminer la version la plus pertinente pour une requête de recherche donnée.
Dans la grande majorité des cas, personne crée intentionnellement des contenus en double. Mais cela existe bien et plus que l’on croit.
En fait, selon Raven, 29 % du Web est en réalité du contenu dupliqué !
Et cela a été confirmé, en 2013, par Matt Cutts, ex employé chez Google.
En 2011, Google a fait une mise à jour appelée Panda, pour tenir compte de la qualité des contenus dans ses résultats.
Aujourd’hui et plus que jamais, Google récompense les contenus de haute qualité. A l’inverse les contenus dupliqués ou de pauvre qualité sont un signe d’un site Web de faible confiance.
En effet, les algorithmes des moteurs de recherche arrivent à trier les contenus en double pour retenir la version la plus fiable.
Dans la plupart des cas, cette approche automatique fait assez bien son travail, mais il existe certaines situations à surveiller, comme, par exemple, pour les pages d’archives dans WordPress, en particulier :
- La page auteur si vous êtes seul à publier,
- ou les pages des étiquettes.
Pourquoi vous soucier de la duplication de Contenu ?
Pour comprendre l’importance d’avoir du contenu unique, il faut d’abord comprendre le fonctionnement des moteurs de recherche.
Comme je l’avais dit dans mon billet sur le référencement SEO, il est important de fournir du contenu de qualité pour obtenir une position intéressante sur les pages de résultats.
Donc, je disais qu’il est important de produire du contenu unique qui apporte de la valeur ajoutée aux internautes.
En effet, c’est l’objectif des moteurs de recherche, notamment Google : satisfaire leurs utilisateurs.
Et Google descend dans ses résultats les sites Web qui ne respectent pas ces règles.
Son objectif est de garantir aux internautes la meilleure expérience de la recherche sur Internet.
En effet, quel intérêt pourrait-on avoir à l’égard d’un site qui ne fait que copier le contenu des autres ?
Il y a des répercussions directes de ce contenu dupliqué sur votre audience !
Sachez que le contenu dupliqué va vous faire perdre votre crédibilité vis-à-vis de Google. Indirectement, vous perdrez également de la crédibilité vis-à-vis de vos lecteurs.
En somme, il faut tout faire pour éviter ce fameux « Duplicate Content » si vous voulez garder votre notoriété sur le web et votre place dans les pages de résultats.
Comment vous prémunir contre le Contenu Dupliqué ?
Il existe différentes manières de se prémunir du contenu dupliqué.
La première chose à faire pour éviter le contenu dupliqué est de dresser un plan cohérent et organiser votre contenu de manière originale.
Écrivez à votre manière, avec vos propres mots.
Toutefois, vous n’êtes jamais à l’abri d’un Duplicate Content signalé même après avoir pris ces mesures.
D’après ce que j’ai pu comprendre, il existe également des outils qui nous aident à vérifier si l’on n’a pas repris les mots d’un autre site ou blog – par erreur ou non.
Il suffit d’ailleurs d’aller faire une petite recherche des termes « détection de plagiat » ou encore « détection de contenu dupliqué » pour avoir un petit aperçu de ces outils.
Entre autres, il y a les très célèbres Plagscan et Copyscape, mais aussi Plagiarisma, Plagtracker, Noplagiat et bien d’autres encore.
Toutes ces plateformes proposent des solutions pour les solo-entrepreneurs et/ou pour les entreprises ayant plusieurs contributeurs sur leur site Web. Bien évidemment, tous ne sont pas gratuits.
Alors bon, pourquoi s’embêter à payer alors qu’il y a des outils gratuits !
Comment fonctionnent ces outils anti-duplicate content ?
Quand je parle d’outils pour vous prémunir du contenu dupliqué, je parle uniquement du texte.
Pour ce qui est des images, il suffit de publier les vôtres ou à défaut de choisir des images libres de droit.
Je vais illustrer mes propos avec Plagscan qui est le meilleur à mes yeux.
Note : je l’utilise pour valider que le texte des articles invités que l’on me soumet sont bien des originaux.
Concrètement, la détection du contenu dupliqué est très simple : il suffit de soumettre un texte.
Pour ce faire, vous copiez-collez un texte brut.
Plagscan travaille pendant quelques minutes et attribue une note à votre contenu.
Comment choisir votre outil « anti-plagiat »
Certains outils disposent de fonctionnalités avancées comme :
- Télécharger un fichier Word, sitemap, ou autres
- Taper une adresse URL d’une page web,
- Voire récupérer vos fichiers depuis Dropbox, Google Drive, OneDrive…
Et certains outils de détection de duplication de contenu sont payants. Les offres payantes varient entre quelques euros à une quinzaine d’euros, selon les options retenues.
Mais quelles sont les grandes différences ?
La différence se situe au niveau de la pertinence des résultats
- Le nombre de sources : avec des offres payantes, l’outil compare votre contenu avec des millions, voire des milliards d’autres sources,
- La précision : les outils gratuits détectent des similitudes avec d’autres contenus mas sans vous donner précisément la partie du contenu considérée comme Duplicate Content. Si vous choisissez une offre payante, vous savez avec précision quelle partie du texte est incriminée. Cela rend alors votre travail de correction très rapide. Autrement, vous devez tâtonner jusqu’à ce que le résultat soit satisfaisant,
- Le nombre de mots : les outils gratuits sont souvent limités sur le nombre de mots. Seules les options payantes savent analyser un contenu de 1 500 voire 2 000 mots.
Au milieu de tout ça, je me demande si toutes ces mesures sont nécessaires si tous les auteurs du web créaient leurs propres idées.
S’ils ne copiaient pas ici et là lorsqu’ils manquent de contenu sur leur blog ou leur site web, ces outils seraient inutiles…
Conclusion sur le Contenu dupliqué
Vous avez probablement entendu le terme « contenu dupliqué » ou « duplicate content » assez souvent, mais de quoi s’agit-il ?
Le contenu dupliqué est un contenu qui apparaît sur plusieurs emplacements sur Internet.
Beaucoup trop de gens pensent cela peut même entraîner une pénalité de la part de Google.
Ce n’est pas vrai.
A priori, il n’y a pas de pénalité pour du contenu dupliqué. Par contre, avoir trop de contenu dupliqué sur votre site Web peut amener Google à vous descendre vos positions dans les pages de résultats.
La meilleure barrière contre le contenu en double, copié et non-original est donc votre capacité à rédiger.
Google cherche la qualité. Il est en permanence à la recherche du meilleur contenu possible qui correspond au mieux aux intentions des utilisateurs.
Mon conseil : assurez-vous de rendre original et de haute qualité tous vos contenus.
Un effet collatéral est la cannibalisation entre mots-clés. Plusieurs publications avec des thèmes trop proches vont rentrer en concurrence. Si c’est le cas, regroupez tous ces contenus en un seul ce qui va donner de bien meilleurs résultats, à la fois en termes de classement, mais aussi de lutte contre le contenu dupliqué.
Qu’en dites-vous ? N’hésitez pas à donner vos avis en commentaires, c’est prévu à cet effet !
Je ne peux pas comprendre que l’on puisse « piquer »du contenu car Il est essentiel de comprendre qu’en 2019, en tant que Webmaster, vous republiez des publications, des communiqués de presse, des reportages ou des descriptions de produits trouvés sur *** d’autres sites ***, vos pages vont certainement avoir du mal à gagner du terrain dans Google
Vous avez raison, « piquer » du contenu ne sert à rien et c’est même contre productif.