Comment contourner le filtre anti-duplicate content de Google
Jan | dimanche 2 septembre 2007 | #33
Le filtre anti-duplicate content de Google n'est pas l'arme absolue. Ce test vise à le démontrer.
Mise à part l'option qui permet de désactiver javascript dans votre navigateur, le filtre anti-duplicate content de Google est bien le pire cauchemar des webmasters de sites MFA.
Ce filtre est à Google ce que son sexe est à Rocco Siffredi: son joujou préféré, sa fierté, et le gage de sa toute-puissance. Un objet assez redoutable pour plonger les spamdexeurs amateurs dans un état de terreur comparable à celui d'une jeune actrice qui voit Rocco se glisser derrière elle au moment où le réalisateur crie "moteur".
Duplicate content == Index complémentaire
Les faits sont là: une page générée automatiquement qui ressemble un peu trop à l'original (celle dont elle s'est "inspirée") a de grandes chances de finir dans l'index complémentaire de Google, et de perdre ainsi toute visibilité.
Pourtant, ce filtre anti-duplicate content n'est pas aussi redoutable que Matt Cutts aimerait nous le faire croire. Il est même relativement facile à contourner, même avec une page 100% auto-générée.
Le test
Afin d'en juger, je mets en ligne un test public sur ce blog. La page de test est ici...
Le contenu de cette page répond à 2 contraintes primordiales pour un MFA:
- il est généré automatiquement, en l'occurrence à partir du premier paragraphe de cette page de Wikipédia,
- il reste lisible pour un visiteur humain.
Dans le but d'échapper au filtre de Google, la forme de ce contenu "volé" à Wikipédia a été modifiée:
- il a été scindé en paragraphes,
- l'ordre de ces paragraphes a été modifié,
- une image a été insérée,
- certaines parties du textes ont été remises en forme, sous la forme de listes, de citations, et de titre <h2> et <h3>
- certains mots ont été mis en italique, en gras ou en souligné,
- des liens ont été retirés et d'autres ajoutés sur certains mots.
Ces modifications touchent exclusivement la forme, et sont donc très simples à réaliser automatiquement. C'était, là aussi, une contrainte choisie pour ce test.
Il aurait bien sûr était possible de "mixer" du contenu extrait de plusieurs sources afin de multiplier les chances d'échapper au filtre anti-duplicate content de Google, mais encore une fois le choix délibéré était de garder ce test aussi simple que possible.
Participez!
Bien évidemment, comme toute page auto-générée, cette page de test a besoin de backlinks pour avoir une chance d'échapper au filtre de Google. Je mets donc en place quelques liens pour l'aider, et vous invite, si vous souhaitez participer au test, à en faire autant. Merci 
<a href="http://bvwg.actulab.net/31-test-anti-duplicate-content.seo">Test anti-duplicate content (ou tout autre texte)</a>
Les résultats
Rendez-vous sur ce blog pour suivre jour après jour les résultats du test.
Wikio ::
Scoopeo ::
Fuzz ::
TapeMoi ::
Nuouz ::
Memes
Digg ::
del.icio.us ::
Blogmarks ::
Bookeet ::
Technorati

Commentaires
Ajouter un commentaire
Les commentaires pour ce billet sont fermés.