Xenu: petit bug avec la balise title
23 Avr 2012
écrit parXenu est un excellent outil gratuit pour vérifier des liens mais aussi pour récupérer l'ensemble des balises <title> et <meta description...> de toutes les pages d'un site.
En faisant un crawl d'un site pour un audit avec Xenu's Link Sleuth, un petit bug a fait son apparition: la colonne<title>déraille dans certains cas.
La colonne title de Xenu
La balise title, qui correspond (en général) au texte de lien dans les SERP's, prend couramment cette forme dans vos pages: <title>Matt Cutts aime les chats</title>.
Mais d'après le W3C , elle peut aussi contenir des attributs HTML comme id (identifier la balise avec Javascript) ou dir (sens de la lecture du titre).
Lors du crawl d'un site, j'ai pu m'apercevoir qu'une page avec une balise TITLE contenant un id (<title id="montitre">Rankera bien qui rankera le dernier</title>) , la colonne correspondante de Xenu n'était pas renseignée. En effet, dès que Xenu trouve cette balise avec un ou plusieurs attributs, il n'extrait pas son contenu et la colonne se retrouve vide.
Xenu utilise un autre élément
Malgré des attributs id, j'avais bien des infos concernant le titre mes pages pour certaines URL, mais qui ne correspondaient pas au contenu de mes <,title>: il va récupérer le texte d'ancre du lien permettant d'y accéder:
Je m'explique: Ma première page crawlée contient un lien vers la deuxième avec le texte d'ancre "Le texte d'ancre trouvé dans la page précédente sera utilisé pour la colonne title". Ma deuxième page a une balise title avec des attributs: (<title id="titre">Ma page avec titre</title>.
Xenu affichera alors le texte d'ancre qui lui a permis d'aller trouver cette deuxième page. A noter que Xenu a ce comportement par défaut quand il trouve une balise <title> vide.
donc...
Xenu ne renvoit pas toujours la bonne balise TITLE des pages, il utilise dans certains cas (attributs dans la balise) les textes d'ancres des liens ce qui peut fausser les informations. Ne faites donc pas de recommandations SEO trop rapidement au sujet des titres de pages {pas|peu} optimisés lors de petits audits avec Xenu, les <title> ne sont pas forcément tous "cliquez ici" ou "plus d'infos".
écrit dans Outils par |