10

Duplicate content et paramètres de tracking, la solution ultime

Duplicate content et paramètres de trackingGoogle Analytics permet grâce à ses paramètres de tracking utm_ d'effectuer un suivi de ses campagnes e-marketing, que ce soit pour des newsletters, partenariats, flux RSS, ou encore le suivi sur réseaux sociaux...

Parmi ces paramètres qui sont à placer en fin d'URL, on retrouve en général utm_source, utm_medium et utm_campaign. Ces URL trackées génèrent malheureusement bien souvent du contenu dupliqué puisque Google n'est même pas capable de gérer ses propres paramètres, et vous font perdre la puissance potentielle de certains backlinks.

Vous me direz que l'on peut restreindre le Duplicate Content avec la gestion des paramètres de Google Analytics ou encore l'élément Canonical. Ce ne sont que des pansements, mieux vaut une URL clean sans paramètre dès le départ 🙂

Google propose pourtant une méthode de tracking alternative qui utilise le fragment identifier # (non lu par les robots car interprété niveau client) à la place de la Query_String. Je vous présente donc ici une méthode qui vous permettra de continuer le suivi de vos anciens liens trackés tout en bénéficiant du linkjuice potentiel qu'ils peuvent vous apporter.

Méthode de suivi avec le séparateur #

Pour utiliser le # comme séparateur dans vos URL avec suivi, vous devrez ajouter l'option suivante: _gaq.push(['_setAllowAnchor', true]); juste avant _gaq.push(['_trackPageview']); dans votre code de tracking.

<script type="text/javascript">var _gaq = _gaq || [];<br />
  _gaq.push(['_setAccount', 'UA-19703096-1']);<br />
  _gaq.push(['_setAllowAnchor', true]);<br />
  _gaq.push(['_trackPageview']);<br />
  (function() {<br />
    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;<br />
    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';<br />
    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);<br />
  })();</script>

Voici le format d'URL à utiliser pour toutes les nouvelles URL à tracker:

http://www.itele.fr/france/video/kerviel-degoute-apres-la-perte-dun-nouvel-episode-judiciaire?utm_source=feedburner&utm_medium=feed&utm_campaign=Feed%3A+itele%2Flaune+(i%3ETELE+-+Une)

deviendra

http://www.itele.fr/france/video/kerviel-degoute-apres-la-perte-dun-nouvel-episode-judiciaire#utm_source=feedburner&utm_medium=feed&utm_campaign=Feed%3A+itele%2Flaune+(i%3ETELE+-+Une)

Vous éviterez ainsi le contenu dupliqué (Plus d'infos ici: http://www.seoland.fr/duplicate-content-regler-le-probleme-du-tracking-dans-google-analytics/) mais vous risquez cependant de ne plus pouvoir suivre vos anciennes URL et surtout de perdre la popularité qui était transféré via les anciennes URL.

Conserver le bénéfice de vos backlinks

lien-naturelDes webmasters, blogueurs ou encore journalistes récupèrent souvent des URL trackées (avec paramètres utm_ d'Analytics) dans des newsletters ou sur les réseaux sociaux par exemple.
Ils risquent de les réutiliser tel quel dans leurs articles pour faire un lien vers votre site, un vrai lien naturel!

Il ne faudrait pas qu'il soit gâché par un Disallow :/*?utm_source dans le robots.txt...

Grâce au module de réécriture d'Apache, nous allons réécrire toutes nos URL pour qu'elles soient adaptées à notre nouvelle méthode de tracking Google Analytics. Cela permettra également de transmettre de la popularité vers une seule et même URL (backlink avec QUERY_STRING...), bye bye DUST!

On utilisera ici une condition de réécriture pour la détection de la chaîne de tracking ainsi que le flag NE (NOESCAPE) pour la redirection 301 afin de ne pas échapper le caractère # (qui se transformerait en "%23" autrement). Le # et les paramètres seront envoyés au navigateur de l'internaute et la chaîne de suivie sera traitée côté client par le script de GA, le tout sans Duplicate, youpee :

RewriteEngine On
RewriteCond %{QUERY_STRING} ^utm_source=(.*)&utm_medium=(.*)&utm_campaign=(.*)$ [NC]
RewriteRule ^(.*)$ /$1#utm_source=%1&utm_medium=%2&utm_campaign%3? [R=301,L,NE]

N'hésitez pas à adapter cette configuration en fonction de la manière dont vous utilisez le tracking de Google Analytics! Enjoy.

10 commentaires

  1. Il y a plein d’autres sources à traiter.
    Bon, c’est réglé now pour GG Reader, mais pourquoi ne pas tordre le cou à toutes les possibilités de dup variables d’un coup ?

    Du genre
    if ($_GET || $_SERVER[‘QUERY_STRING’] != “” || substr($_SERVER[‘REQUEST_URI’],-1) == “?”

  2. Merci pour cette astuce jusqu’à présent j’utilisai l’attribut rel=”canonical” mais comme tu dit c’est pas parfait, ta méthode me parait bien plus propre et simple à mettre en place.

  3. Excellent article, et excellente solution pour corriger ce défaut.

    Après, il faut relativiser quand même car Google parvient parfaitement à détecter ce genre de paramètre et à attribuer les liens et la popularité à la page réelle. D’ailleurs, le centre webmaster donne pas mal d’infos là dessus.

    Et si l’on paramètre correctement la balise canonical, cela ne devrait pas poser de problème.

  4. Belle trouvaille !
    Toutefois, je suis totalement d’accord avec Daniel, Google doit tenir compte de tout ca dans ses règles concernant le duplicate content. Particulièrement, si cela concerne des trackers Google.
    Mais il faudrait tester cela pour confirmer !
    En attendant, merci d’avoir partager cette astuce !

  5. Hmmm… j’aime beaucoup ta suggestion Laurent, hélas, il existe encore de nombreux cas où les paramètres d’URL représentent vraiment un changement de contenu (tous les CMS ne sont pas tous égaux face à la ré-écriture d’URL bien faite -_-)

  6. Ton approche est intéressante, je vais voir si je fait la modifications sur l’ensemble de nos sites. Sachant que généralement les URLs trackés sont utilisé pour les campagne d’achat display je ne sait pas si c’est pertinent de faire des modifications.

    A réfléchir, merci pour l’ouverture d’esprit sur le sujet.

    Bonne continuation,
    Pierre

  7. Merci pour l’astuce, ça peut être utile sur certain plus ancien avec de nombreuses URLs différentes… Je vais en parler à mon patron ^^

  8. j’adore la partie ” Google n’est même pas capable de gérer ses propres paramètres” lool
    Supers astuces sinon

  9. Merci pour la dernière astuce sur le Disallow :/*?utm_source pil poil ce que je cherchais…

    @boablaster : Merci pour le lien !

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *