Exploitons les statistiques Google Webmaster Tools
Pour analyser les performances d’un site web, sa visibilité et donc en quelque sorte mesurer son référencement, on a les web-analytics. Le service Google Analytics s’est assez largement imposé et les webmasters se sont plus ou moins familiarisés avec cet outil statistique. Mais la console Google Webmaster Tools fournit elle aussi quelques données statistiques, données dont on ne parle que très (trop?) peu mais qui révèlent certaines informations précieuses et parfois surprenantes. Petits tours de passe-passe avec les stats issues des Webmaster Tools.
L’onglet “statistiques” de la console GWT est principalement composé de 2 tableaux disposés côte-à-côte.

Ces statistiques, dont certaines ne sont pas disponibles via d’autres outils, et donc difficilement accessibles à la concurrence, peuvent, entre autres, nous livrer des informations concernant la performance en terme de positionnement générateur de trafic, mais aussi des informations concernant la répartition des clics des utilisateurs dans les pages de résultats naturels.
Trafic Organique: mesurer la performance autrement
Intéressons-nous au tableau de gauche, intitulé “Impressions”. Google nous indique qu’il s’agit des
20 requêtes les plus fréquentes pour lesquelles votre site est apparu dans les résultats de recherche et du pourcentage des 20 requêtes les plus fréquentes que représente chaque recherche.
Il s’agit donc d’informations précieuses: pour chaque site, et chaque semaine, Google livre les 20 requêtes les plus demandées (donc les + génératrices de trafic) et ayant simplement fait apparaître le site dans les SERPs, ainsi que la position moyenne du site sur ces requêtes. Ces données sont donc pertinentes pour des sites ayant déjà une certaine visibilité sur leurs mots-clés car il s’agit des affichages (impressions) réels: si votre site est en page 50, et que personne ne consulte cette page, la requête n’apparaît pas dans ce tableau de gauche. Si votre site est trop jeune, ou pas du tout référencé, ces données ne vous apprendront donc pas grand chose.
Même si les conditions exactes de collecte de ces données semblent opaques, Google nous suggère ici des objectifs et des sources de trafic et nous permet donc d’évaluer d’une façon originale le positionnement d’un site sur les requêtes génératrices de trafic: si les logiciels de requêtes automatiques nous permettent de mesurer la performance du positionnement sur des mots-clés choisis et fixés, ces données-là nous permettent de mesurer la performance sur des mots-clés dynamiques et réactifs auxquels on ne pense pas forcément, ou encore des mots-clés passés inaperçus lors de l’audit de mots-clés initial.
Alors que le logiciel de positionnement est statique (ce sont souvent - et à tort - les mêmes mots-clés qui sont testés pendant des mois), les statistiques issues du tableau de gauche sont, elles, dynamiques et réactives aux variations et à l’évolution de la demande en rapport avec les thématiques abordées par un site et ses pages.
En faisant la moyenne des positions du tableau de gauche (en violet sur la capture), on peut donc, à un instant t, mesurer en partie les performances en matière de positionnement générateur de trafic.
Plus cette position moyenne est basse, et plus elle est stable dans le temps, mieux vous êtes positionné sur ces fameuses 20 requêtes dynamiques, et + vous drainez de trafic. Et + l’écart-type est petit, + le tir est groupé.
Gros bémols:
- la notion de trafic qualifié n’est pas abordable via cette moyenne. il s’agit ici de trafic pur.
- se baser sur des données bridées à 20 requêtes peut s’avérer insuffisant, surtout pour les gros sites généralistes positionnés sur des milliers de requêtes génératrices de trafic.
- pour les sites trop jeunes, ou/et mal référencés, les 20 requêtes pour lesquelles le site est apparu sont peu pertinentes: même si la moyenne des positions moyennes est plutôt basse, le site n’est en fait pas visible sur les bonnes requêtes.
moyennes et écarts-types des positions moyennes d’un site web,
sur 6 mois et pour les 20 requêtes ayant affiché le plus souvent
ce site web dans les résultats naturels

(et j’espère que vous ne vous attendiez pas à des graphiques en ajax hein. si?)
Pour le site étudié, plutôt bien référencé, on remarque donc que la moyenne des positions moyennes se situe autour de 7, et est assez stable sur les 6 mois étudiés. Cela signifie que chaque mois, sur les 20 requêtes les plus tapées, en rapport avec les thématiques des différentes pages du site, (requêtes qui peuvent changer chaque mois), le site étudié est systématiquement en première page, et en moyenne en place 7.
La visibilité dynamique de ce site est donc plutôt bonne, puisqu’on observe un tir bien groupé (cf. écart-type plutôt faible) autour de la place 7. Néanmoins, il faut mieux faire: toutes les requêtes affublées de “gros pourcentage” (c-à-d demandées) et pour lesquelles le positionnement est moyen, sont à travailler et peuvent s’avérer être des sources de trafic supplémentaire non-négligeables pour ceux qui n’auraient pas correctement effectué leur audit de mots-clés, ou pour ceux qui ne l’auraient pas refait régulièrement: les habitudes de recherches évoluent, les utilisateurs évoluent, il y a des saisons, des tendances, des nouveautés, du contenu neuf sur le site étudié, bref, un audit de mots-clés ne se fait pas une fois pour toutes, mais il se corrige et s’évalue en permanence.
Voici ce que donnerait un site systématiquement 1er sur les 20 requêtes les plus demandées du mois, et en rapport avec son (ses) secteurs et sa (ses) thématique(s).

Ici, le positionnement moyen, chaque mois, est de 1 et l’écart-type est de 0. La performance paraît donc optimale, le site répond à la demande, s’adapte aux évolutions saisonnières, thématiques et sémantiques, et son positionnement est parfait sur ces 20 requêtes les + demandées ayant fait apparaître le site dans les SERPs. Il s’agit bien sûr ici d’un exemple d’une performance optimale aussi difficile à atteindre qu’à maintenir sur la durée. Dans l’idéal, l’objectif est donc de tendre, chaque mois, vers un tableau de gauche identique à celui de droite, avec les mêmes mots-clés, dans le même ordre, et des positions toutes égales à 1, à condition que l’audit de mots-clés initial ait été correctement effectué (cette précision est très importante pour exploiter correctement ces statistiques).
Bien sûr, ces données sont à analyser avec soin car elles trouvent rapidement leurs limites: Google ne met à notre disposition que 20 lignes dans ce tableau et, au risque de me répéter, cette moyenne n’apporte des informations pertinentes que pour les sites déjà visibles et bien positionnés.
Et de votre côté, quel est la position moyenne de votre site, pour ce tableau de gauche? Si elle est supérieure à 10, votre site est encore loin de ses potentialités en termes de trafic pur!
Mesurer, pour chaque thématique, les taux de clics dans les résultats naturels
Passons au tableau de droite, intitulé “Trafic”. Google nous indique qu’il s’agit des
20 requêtes les plus fréquentes ayant permis aux internautes d’atteindre votre site et du pourcentage des 20 requêtes les plus fréquentes que représente chaque clic.
Là encore, il s’agit d’une information non-disponible ailleurs: Google nous indique ici, pour chaque site, et pour chaque période, les taux de clics dans les résultats naturels, pour les 20 requêtes ayant le + mené sur votre site. On a donc, associés, une position et un taux de clic. Il ne reste donc plus qu’à établir le graphique!
Pour élaborer le graphique ci-dessous, 5 sites web correctement positionnés ont été étudiés sur 6 mois. Il en résulte donc 6 x 5 x 20 = 600 couples position<>taux de clic. Sur ces 600 couples de données, seuls les taux de clic des requêtes pour lequel le site est positionné en première page ont été retenus, les données concernant les positions supérieures à 10 (au-delà de la première page) n’ont pas été intégrées. Au total, ce sont donc 554 couples position<>taux de clic qui ont été utilisés pour établir ce graphique, provenant de 5 sites web différents et de 5 thématiques différentes.
A donc été calculée la moyenne des taux de clics associés à chaque position. Par exemple, sur la capture (voir ci-dessus), on trouve, en jaune, les taux de clics associés aux positions 4, en vert, les taux de clics associés aux positions 6 et ainsi de suite. Il suffit ensuite de faire la moyenne des taux, position par position, sur plusieurs mois et sur plusieurs sites, pour obtenir un semblant de tendance
:
taux de clics moyens dans les résultats naturels,
en fonction de la position en première page Google,
pour les 20 requêtes les + fréquentes suivies d’un clic,
sur 6 mois et pour les 5 sites étudiés

Même si les 554 couples taux de clic<>position sont insuffisants pour établir une règle générale, et spécifiques aux 5 sites étudiés, et même s’il existe un biais lié à la qualité des balises <title> (qui, on le sait, peut influencer fortement les taux de clics dans les SERPs naturels et qui explique certainement les artefacts observés pour les positions 4 et 8), on retrouve clairement l’allure des courbes représentant les taux de clics dans les résultats naturels de Google, publiées depuis longtemps mais obtenues autrement. Il est d’ailleurs probable que ces courbes varient selon la thématique et le type de la requête, c’est pourquoi il peut être intéressant d’établir cette courbe pour chaque site afin de définir de nouveaux objectifs plus spécifiques et plus pertinents. On note également très clairement le phénomène de “prime au 10ème” qui paraît même démesuré puisque d’après ce modeste graphique, mieux vaudrait être 10ème… que 2ème ou 3ème!
Autre information, quand on additionne les taux de clics moyens sur les résultats 1-10, on trouve un total de 92.5: sur 100 clics dans les résultats naturels, 92.5 se sont portés, en moyenne, sur la première page (résultats 1 à 10). Pour ces 5 sites étudiés, et pendant la période étudiée, seuls 7.5% des clics dans les résultats naturels ont été effectués au-delà de la première page de résultats Google, pour les 20 requêtes les + cliquées.
Un tas d’autres informations précieuses peuvent être extraites de cet onglet statistiques des Google Webmaster Tools, je vous laisse le triturer tout seuls.
15 octobre 2008 à 17:45
Particulièrement intéressant, merci !
16 octobre 2008 à 16:46
Un article original et très intéressant, si j’ai pas trop la flemme j’essaierai de faire de même histoire de comparer tiens. Merci !
16 octobre 2008 à 16:54
trés bon article .. il arrive au bon moment !!
18 octobre 2008 à 9:46
Intéressant
le compte webmaster-tools est effectivement de plus en plus un outils à utiliser (j’utilise d’allieurs d’autres parties pour des autres tests).
Pourtant, le raisonnement ne tient que sur le positionnement globale. Le téléchargement (télécharger les données) est nettement plus large. On se rencontre par exemple que les recherches sont totalement différents d’un pays à l’autre, et les taux de clics encore plus différents, même positionnés à la même place. Par exemple, pour le maroc et les Etats Unis, mon pseudo est le plus recherché dans les résultats affichés et le plus cliqué, il n’apparaît quasiment pas dans les autres pays.
En plus, le taux de click varie suivant la description ou plutôt sur l’idée de recherche dans l’esprit de l’internaute. J’ai deux sites qui se positionnent souvent sur les mêmes recherches. Bizarrement, une position 13 me rapporte plus qu’une position 8 (c’est également ce que donne mes stats XITI).
Etudiez des statistiques est certainement intéressant (félicitation pour ce joli travail), mais doit tenir compte d’autres parties plus subjectives, comme la notoriété du site, la description affichée, … ou même la période hivernale et estivale (les taux de rebond sont souvent nettement différents, mais également jusqu’où va l’internaute dans ses recherches). Sans trop donner d’exemple, une location de vacance sera vue à la 10ième page en période prévacances et à peine vue à la deuxième page en hiver (sauf pour la montagne). Evidemment, il y aura également moins de recherches. Dans des sites techniques, la durée de visite augmente avec l’hiver mais également le taux de visites en fond de classement de la première page, voire des deux suivantes. Les gens ont plus le temps, tout simplement.