WordPress et les URL de catégories: le bug
15 Juil 2012
écrit parOuille Aïe Aïe!!! Alors que je testais un nouvel outil SEO du nom de Minalyzer pour la rédaction d'un prochain article (qui est loin d'être fini vu l'interface peu intuitive de ce crawler), j'ai eu la surprise de voir des URL de catégories WordPress assez étranges remonter.
Bug de WordPress? Erreur de programmation? J'ai découvert que l'on pouvait générer du contenu dupliqué sur les blogs utilisants WordPress en toute facilité.
URL de catégories buggées
Par défaut, quand on appelle une URL de catégorie sous WordPress, c'est sous cette forme: http://www.domain.com/%category% (où "%category%" correspond à l'identifiant de la catégorie appelée). La page affiche les derniers articles de la catégorie comme ici: http://www.yapasdequoi.com/category/seo
Mais en rajoutant plusieurs fois l'identifiant de la catégorie à la suite en séparant chaque occurrence avec des slashs, WordPress renvoie toujours le contenu de la page catégorie, sans aucune erreur 404 mais bien avec un status 200 dans l'entête HTTP.
Après avoir testé si ça ne venait pas que de mon thème/blog, j'ai essayé d'appliquer la même méthode sur d'autres sites WordPress: cela se produit avec tous les blogs WordPress.
Quelques exemples:
- http://wordpress.org/news/category/community/community/community/community/
- http://wordpress.org/news/category/community/community/
- http://www.blog-pes.com/category/news-pes/news-pes/news-pes
Je ne mets pas d'URL des copains blogueurs SEO en exemple, je ne voudrais pas leur générer du contenu dupliqué...
Essayez sur votre blog WordPress, vous verrez qu'aucune 404 ne pointe le bout de son nez!
Et alors, ça fait quoi?
Rien de très grave à priori, mais un thème mal codé ou une erreur de lien pourra vous générer du beau contenu dupliqué. Quand au NSEO, ça me semble très peu probable avec cette méthode.
Mais le Duplicate Content n'étant jamais bon, vous pouvez donc vous prémunir de ce bug en utilisant la balise <link rel=canonical dans les pages catégories, mais perso, ça n'est pas mon truc. Un petit hack dans le fichier functions.php? une règle de réécriture? ça reste à creuser.
Voilà, je voulais juste vous informer de cette petite découverte, qui reste pour moi une anomalie de WordPress... C'est un article du dimanche hein, ne m'en voulez pas 😀
écrit dans Drupal, Wordpress et SEO par |