La balise meta noindex et NSEO, attention!
19 Juin 2015
écrit parHier, j'ai vu passer un post de Gary Illyes (Webmaster Trends Analyst chez Google) qui m'a interpellé : https://plus.google.com/+GaryIllyes/posts/ZPPrxASiXf3
En effet, il annonce que la balise <meta name="robots"> est lu et comprise par Google à l'extérieure d'une section HEAD d'une page Web, ce qui signifie concrètement qu'une balise <meta name="robots" content"noindex"> placée dans la partie <body> d'une page d'accueil par exemple, pourrait tout simplement sortir une homepage de l'index Google.
Violent non?
Le test du noindex dans le <body>
Afin de s'assurer que cette info était bien réelle, Sir Jessy Seo Noob a fait un test sur son site:
- 1 article standard
http://www.love-moi.fr/2015/06/la-confirmation-que-cet-article-sindexe.html
- 1 autre article, mais contenant cette fois ci une balise meta noindex dans la partie centrale de la page:
http://www.love-moi.fr/2015/06/le-test-qui-confirme-ou-pas-la-regle.html
Les 2 URL ont reçu des liens, des pings par plusieurs twittos, et ont été "Explorés par Google" via Google Search Console. Le résultat du test est là:
La première page a été indexée:
La deuxième page (avec noindex dans le body) n'a pas été indexée:
SEOmuscle à d'ailleurs confirmé cette info:
@nekkio @aymerictwit oui il a annoncé cela au SMX aussi - vis a vis du fait que GG interprete pleins de trucs (et notammetn ajax)
— Julien Berard (@seomuscle) June 18, 2015
Vous allez me dire: et alors? et bien je vais vous répondre que c'est une porte ouverte pour du NESO sur certains sites...
NSEO avec cette noindex
Imaginez un site qui ne filtre pas les balises <html>, ou encore qui ne filtre que certains éléments HTML (script, link,...) sauf les <meta>. Via cette faille XSS, un internaute mal intentionné pourrait alors injecter une balise de ce type dans vos pages, pour les faire désindexer purement et simplement.
Cette directive noindex pourra très bien se retrouver sur une page d'accueil d'un CMS mal sécurisé (ou via des plugins mal sécurisés):
- Site de communiqué de presse
- Derniers avis
- Top commentaires
- Forum
- Dernières petites annonces
- etc.
Alors vérifiez bien que vos sites ne permettent pas ce genre d'injection, au risque de vous faire désindexer vos pages par des webmasters malveillants, ou encore de vous faire perdre le potentiel de transmission de jus d'une page via le nofollow.
Cette article a été écrit dans le but de vous sensibiliser afin de contrer ce type d'attaque, et en aucun cas pour vous inciter à effectuer ce genre d'actions. Ma responsabilité ne pourrait être engagée en cas d’utilisation de ces techniques. Pour rappel, le NSEO c'est de la concurrence déloyale.
Soyez prudents et sécurisez vos sites 😉
PS: Merci encore à Merci à Jessy Seo Noob pour son test! Retrouvez-le sur Twitter: https://twitter.com/jessyseonoob
écrit dans Crawl et indexation par |