Les pénalités Google KeyBox et FeedBox
C’est un peu le bazar sur Google en ce moment, hein. Comment ça, pas chez vous? Il semblerait qu’il se soit passé quelque chose autour des 26 et 27 juin 2008. Quand certains n’hésitent pas à en appeler au hasard en inventant une Random Penalty qui peut s’avérer confortable dans la mesure où il n’y a plus besoin de chercher pour comprendre, j’ai de mon côté essayé d’analyser un peu ce qu’il se passait et il en ressort deux néo-logismes, l’un pour une pénalité assez ancienne et l’autre pour une pénalité beaucoup plus récente: Google KeyBox et Google FeedBox. C’est joli, non?
N.B. Cet article n’est fondé sur aucune étude scientifique mais uniquement sur de longues heures d’observations ainsi que de longues heures de lecture de (com)plaintes sur les forums et de compte-rendus de crash. Concernant les causes possibles de ces deux “sanctions”, il s’agit de pures hypothèses à vérifier, et non-exhaustives.
Mise à jour des courbes Google Trends
(ce paragraphe, rédigé le 31 juillet, est un complément à l’article initial publié ci-dessous le 15 juillet)
Les courbes Google Trends Websites ayant été mises à jour en cette fin juillet, voici les captures d’écran de deux sites fortement pénalisés autour du 26 juin (voir article ci-dessous). Ces nouvelles courbes vont dans le sens des tendances observées via les courbes Alexa: il s’est bien passé quelque chose autour du 26 juin. Notez que le site web-libre.org (un site à gros trafic), non abordé dans l’article initial mais très lourdement pénalisé le 26 juin, propose un annuaire mais aussi (et surtout?) un système d’actualités qui semble reprendre certains flux et articles (wikipedia ou autres sites) en les modifiant légèrement (à la main, semble-t-il), il suffit de faire une recherche Google sur certains extraits des articles proposés pour s’en rendre compte. Par contre, très peu (aucun, en fait) de liens sortants sur ces articles d’actualité, ainsi que sur le site en général, annuaire mis à part. Google serait donc dorénavant en mesure de détecter le duplicate content sur de petites parties de pages voire des petites parties de phrases (plutôt que d’effectuer l’analyse sur le contenu global d’une page). Il n’est donc plus possible de créer des pages “patchwork” reprenant un peu de contenu par ici, un peu de contenu par là et mélangeant le tout. Ces nouvelles données ne permettent donc pas d’infirmer l’hypothèse FeedBox, bien au contraire…


La pénalité KeyBox
Construit sur le terme sandbox (bac à sable en français, pénalité en général provisoire touchant certains sites jeunes qui ont appuyé un peu trop fort sur la pédale), le terme keybox me semble bien décrire ce qu’il se passe pour certains sites. En effet, une partie (une partie seulement) des webmasters pénalisés ces derniers mois ne le sont que sur certains mots-clés; on ne parle donc plus ici de page pénalisée, ou de site entier, mais bien de mot-clé. Souvent, il s’agit des mots-clés principaux, ou plutôt des mots-clés pour lesquels un certain travail de référencement a été effectué.
Voici quelques pistes concernant les causes probables de cette sanction bien spécifique:
- abus de backlinks ancrés sur ce mot-clé: en d’autres termes, une concentration suspecte, toute ancres confondues, du même mot-clé. il s’agit maintenant de trouver quelle est cette proportion limite, si elle existe. exemple: une page reçoit 100 liens en tout; sur ces 100 liens, 90 contiennent, sous une forme ou une autre, le mot-clé visé càd 90% ce qui pourrait être beaucoup trop. solution envisageable: obtenir d’autres liens ancrés différemment pour diluer cette concentration excessive.
- abus de liens internes ancrés sur ce mot-clé: idem que ci-dessus mais concernant les liens internes. solution: idem que ci-dessus.
- optimisation OnPage trop flagrante: à trop suivre les dictacts du W3C (entre autres), tout le monde finit par se retrouver avec du OnPage optimisé et bourré de keywords (title, h1, h2, balisage sémantique, etc.) or aujourd’hui, je crains qu’optimisé et propre ne veuille dire, dans certains cas, sur-optimisé, pour M. Google. Solution [mode provoc] salopez légèrement votre code (ça va taper, là, je le sens) [/mode] ou plutôt diluez-le.
- d’autres causes.
La pénalité FeedBox
L’information n’a pas encore beaucoup filtré, mais depuis le 26 juin, de nombreux (et gros) sites agrégateurs de contenu (ou autres sites reprenant du contenu) se sont vus lourdement, mais alors très lourdement, pénalisés. Ce sont des sites qui reprennent le contenu d’autres sites, en toute légalité et souvent avec l’accord des webmasters concernés. Voici par exemple le graphique Alexa pour Dicodunet:

D’autres sites connus seraient touchés: digg.com, scoopeo.com, paperblog et d’autres. Même si nous entrons dans une période creuse due à la saison et aux vacances, de telles chutes de trafic ne peuvent pas s’expliquer uniquement par ce facteur saisonnier.
Il semblerait donc que les agrégateurs de contenus, souvent considérés (et souvent à tort, mais pas toujours) comme des voleurs de contenus, des faiseurs de Duplicate Content (contenu dupliqué), des usines à contenu facile, des spammeurs de SERPs, soient directement dans le collimateur de Google en ce début d’été.
La question, c’est de savoir comment Google a fait pour repérer ces sites. Peut-être une évaluation humaine. Peut-être une analyse du comportement de l’utilisateur, notamment au niveau des taux de rebond (bounce rate) et du nombre de clics séparant la recherche du résultat réellement recherché par l’internaute: en effet, ces sites ne sont que des passerelles, parfois utiles, mais des passerelles tout de même. Google a peut-être décidé d’offrir directement le contenu original aux utilisateurs. Peut-être un simple affinage du filtre Duplicate, ou peut-être autre chose.
Le phénomène semble assez différent de celui touchant les annuaires, notamment parce que ces derniers sont pénalisés depuis plus longtemps: il s’agit ici de ce qu’il s’est passé autour du 26 juin et qui semble toucher des sites assez particuliers sur le plan du contenu et de la structure. D’autres hypothèses concernant la pénalisation spécifique des annuaires sont en train d’émerger.
Est-ce alors la mort de ce type de sites? Sûrement pas. Il s’agit simplement de repenser la manière (au sens technique et structurel) de rediffuser les flux et autres sources de contenu utilisées par ces sites, afin de passer au travers de ce nouveau filtre/pénalité. Nul doute que leurs propriétaires, dès qu’ils se pencheront sur le problème, trouveront des solutions pour surmonter le problème et rebondir.
15 juillet 2008 à 17:50
La pénalité Feedbox est quantifiable, observable, et explicable. Les “repreneurs de contenu” n’apportent aucune, ou peu de valeur ajoutée au Web. Google a toujours voulu privilégier le contenu utile, original et inédit.
Pour la pénalité Keybox, j’émets quelques réserves, car elle n’est pas directement observable. Et si Google classe mieux des sites non-optimisés que des sites optimisés, c’est tout l’art de la SEO qui disparait
15 juillet 2008 à 18:49
Article intéressant Wikio rencontre aussi des problèmes avec Google (Cette info m’a été confirmé par un membre de leurs équipes).
15 juillet 2008 à 19:16
Pour DDN, Paperblog et Wikio, la sanction est justifiée. Il n’y a pas de “feedbox”, juste la sanction méritée pour duplicate!
15 juillet 2008 à 19:55
Bonjour,
J’ai lu que plusieurs annuaires ont été touché. Pourtant les annuaires ne sont pas des agrégateurs non ?
Comment expliques tu cela ?
Laura
15 juillet 2008 à 20:02
bonjour Laura
une seule pénalité ne peut pas expliquer tous les déclassements, il s’agit sûrement, pour les annuaires, d’un autre type de pénalité dont on va sûrement parler prochainement, ici ou ailleurs.
néanmoins, certains annuaires sont malgré eux des agrégateurs, ou du moins des fournisseurs de contenu dupliqué, quand leurs webmasters ne vérifient pas que les descriptions fournies sont déjà présentes 10 ou 100 fois, sur d’autres annuaires.
15 juillet 2008 à 22:30
Joli le keybox, je constate bien des pénalités sur quelques expressions bien ciblés, ton explication contient très certainement une partie de l’explication mais quelque-chose me dit que c’est plus compliqué. Après je travaille pas chez google donc… En tout ca joli billet
15 juillet 2008 à 22:50
Tout à fait d’accord avec WebUnited, on serait alors revenu à l’âge de pierre en matière de référencement !
16 juillet 2008 à 0:14
J’aime beaucoup cette idée de keybox, je l’ai reprise dans un article.
Ce n’est pas un retour à l’âge de pierre… mais une complexité de plus à gérer.
16 juillet 2008 à 0:16
[...] J’ai trouvé une analyse très intéressante d’une référenceuse, qui parle des pénalités Keybox et Feedbox. [...]
16 juillet 2008 à 1:14
Généralement, un “faiseur de Duplicate Content” n’obtient rarement les yeux doux de google.
Par contre, le trafic issu de ces sites provient souvent d’une combinaison de mots clés issus de différents “bouts” de contenus agréggés (sans réel rapports entre eux). Il y a peut-être eu pénalité dans ce sens là.
16 juillet 2008 à 7:55
et à votre avis le busby seochallenge il va la manger quand la pénalité ?
Ou alors on nage tous dans la sandbox keypenalty ha ha hah
on verra il faudrait continuer le concours après la date échéante et regarder ce qui se passe mais le plus bourrin c’est le numéro 1….
il faut refaire des concours comme ça de ^d’une durée de un an. zepo ^^
16 juillet 2008 à 7:55
Merci pour le back link
16 juillet 2008 à 7:59
Le type de site “passerelle” est de toute manière visé par Google comme nuisible. Il me semble logique de penser qu’ils sont enclins à tomber un jour ou l’autre. Google (et l’internaute) préfère la mise en valeur de pages qui proposent directement l’information pertinente plutôt qu’être un simple relais vers ailleurs.
16 juillet 2008 à 13:41
Salut,
Sur GG Trends, je ne vois pas de chute énorme des stats de WRI, DND, Wikio ou Paperblog.
http://trends.google.com/websites?q=dicodunet.com%2C+webrankinfo.com&geo=all&date=mtd&sort=0
http://trends.google.com/websites?q=wikio.com%2C+paperblog.fr&geo=all&date=mtd&sort=0
Ni même sur Alexa, sauf il est vrai sur DDN, mais Alexa n’est pas plus fiable que GG Trends.
S’il y a dépositionnement, pas besoin d’inventer de nouveaux concept le filtre Duplicate Content peut tout aussi bien l’expliquer.
@Ranks : Ce que tu dis sur les “bouts” est tout à fait vrai, c’est une bonne partie de la longue-traîne de ces sites, en particulier de DDN, or cela ne se justifie tout simplement pas. Là on touche directement à l’algo d’analyse de contenu de Google.
16 juillet 2008 à 13:48
@alex
personne n’a parlé d’une pénalité pour WRI.
d’autre part, les courbes Google Trends s’arrêtent… autour de la mi-juin (hasard, ou autre chose?)
il faut donc attendre leur mise à jour pour analyser les données, nous n’avons donc qu’Alexa pour le moment.
16 juillet 2008 à 17:45
“une seule pénalité ne peut pas expliquer tous les déclassements”
Si … admettons qu’on considère un site multi-thématique, dont les pages ont la structure suivante :
mots-clefs dans un même champ sémantique, suivis et/ou précédés de lien(s) vers un site du même champ, le tout répété et sur de nombreux champs distincts.
on se retrouve à matcher d’un seul coup tous les annuaires ET “digg-like” (scoopeo compris)
16 juillet 2008 à 19:42
Ne serait-ce pas Google qui cherche à s’imposer auprès de concurrents indirects tels que Wikio, Scoopeo et compagnie ?
“Google n’est pas notre ami”
16 juillet 2008 à 20:15
personnellement, à lire tous les problèmes que rencontrent un jour ou l’autre tous les webmasters, google nous impose une sorte de Diktat que je trouve d’une ignominie sans borne. c’est tout simplement inacceptable.
17 juillet 2008 à 1:23
Merci pour cet article fort intéressant !
17 juillet 2008 à 10:57
Ce qu’il faut comprendre dans cet article très intéressant, c’est que Google s’est donné comme mission de faire la pluie et le beau sur le Net et surtout d’avoir la primeur et la mainmise sur tout ce qui se pase sur Internet.
Regardez son lively et autres modules qui existent déjà sur d’autres plateformes. Google pénalise les agrégateurs de liens qui lui font de l’ombre. Il veut avoir à lui tout seul la primeur sur toute info qui circule sur le Net.
Il a cassé tous les autres annuaires, maintenant c’est au tour des agrégateurs de contenus en les accusant de duplication. Alors que le Web 2.0 favorise l’échange et le partage d’infos. Alors, est-ce qu’il n’y a pas dans son viseur des sites comme facebook ou tout autre social bookmarks qui risquent d’être de sérieux concurrents dans les mois à venir ?
Google a retenu la leçon qu’il a lui même infligé à Yahoo! qui l’a laissé venir le détroner ! A bon entendeur …
17 juillet 2008 à 10:57
La pénalité Google KeyBox et pénalité FeedBox…
C’est un peu le bazar sur Google en ce moment, hein. Comment ça, pas chez vous?…
17 juillet 2008 à 11:02
La penalite Google KeyBox et pénalité FeedBox…
C’est un peu le bazar sur Google en ce moment, hein. Comment ça, pas chez vous? Il semblerait qu’il se soit passé quelque chose autour des 26 et 27 juin 2008. Quand certains n’hésitent pas à en appeler au hasard en inventant une Random Penalt…
17 juillet 2008 à 11:05
Ce article est tellement intéressant que je l’ai bookmarké sur mon digg-like Expert-du-Net.com. Au rique d’être sanctionné ….
17 juillet 2008 à 18:41
Super intéressant ! J’avais rien remarqué ^^
18 juillet 2008 à 13:34
@admin : Oui désolé, j’ai zappé que le phénomène était récent
19 juillet 2008 à 14:06
Si on accepte les hypothèses lancées dans cet article et si on analyse ça d’un point de vue d’affaires, Google a avantage à trouver un équilibre entre deux points divergents.
1. Puisque tout le monde utilise son moteur de recherche, s’assurer que les résultats supporte le plus possible ses propres produits et nuisent le plus possible à ses concurrents. (En respectant les lois sur le commerce, bien sûr.)
2. S’assurer que ses résultats soient les plus crédibles et les plus pertinents possible, pour que tout le monde continue d’utiliser son moteur.
Et puisque les budgets de SEO sont en concurrence directe avec ceux du PPC, je m’assurerais que le SEO ne donne pas de résultats prévisibles.
20 juillet 2008 à 19:10
Bonour Carole,
Je me suis permis ceci à titre humoristique:
http://blog.axe-net.fr/penalites-google/
N’hésite pas à me dire si je dois continuer à afficher la paternité (maternité ?) des expressions feedbox et keybox
21 juillet 2008 à 8:08
Là les courbes de google trends ont l’air de dépasser début juillet… et pourtant pas l’impression d’avoir de perte pour les sites indiqués …
22 juillet 2008 à 13:04
La pénalité Google KeyBox et pénalité FeedBox…
De nouvelles pénalités chez Google, c’est ce qu’essaie de démontrer ce blog sur le référencement. C’est toujours intéressant à lire….
4 octobre 2008 à 23:02
Excellent et belle observationS,
Cependant sur :
“abus de liens internes ancrés sur ce mot-clé: idem que ci-dessus mais concernant les liens internes. solution: idem que ci-dessus.”
Un contre exemple : wikipedia, avec le module autolink, tous les liens internes ont le même ancre et pourtant elle est toujours en premier sur la presque totalité des mots clés génériques.
Peut être un avant goût avant un déclassement de wikipedia (avec l’histoire des liens knol supprimés par les modos de la wiki … )
4 octobre 2008 à 23:43
@ dudd:
attention, pour wikipedia vous parlez des liens internes, alors que “keybox” concerne surtout les ancres des liens externes (ancres des backlinks, càd des liens provenant de l’extérieur)
10 octobre 2008 à 18:50
Excellent! Une nouvelle trouvaille ce blogue, j’ajoute à mon agrégateur.