Chez Google, ce sont vraiment des (not provided)

le 29/05/2012 par Maxime ARNSTAMM
Tags: Software Engineering

En octobre 2011, Google nous a sorti une des petites blagues dont ils ont le secret : le coup du (not provided). Pas de recours, pas de regrets. Ils en rigolent encore.

Six mois plus tard, où en est on ? Comment réagir ? Quelles sont les perspectives ?

C'est quoi ce (not provided), alors ?

Quand on cherche à vendre un produit ou une solution sur internet, Google, avec ses 92% de parts de marché, s'impose très vite comme le pourvoyeur majeur de contenu ciblé.

Là où un réseau social pousse du contenu que vous n'avez pas demandé, la recherche sur un moteur est une action volontaire pour trouver la réponse à votre problème.

Il devient donc vital pour le site web de se positionner comme réponse aux questions de leurs clients potentiels. Exemple : si vous vendez une assurance auto pas chère, vous voudrez vous positionner sur "assurance auto pas chère" plutôt que sur "assurance". Le but est de vous assurer que toute personne se rendant sur votre site par ce biais soit là pour les bonnes raisons, et donc soit tenté d'acheter.

Pour optimiser votre positionnement, il faut bien cibler votre clientèle. Pour ça il est important d’en connaître le plus sur eux. Typiquement : d’où viennent-ils et où vont-ils ? C'est là qu’entrent en jeu les outils d’analyse de trafic, dont le plus connu : Google Analytics. Vous allez pouvoir connaître l’une des informations clé : qui sont les gens qui achètent ?

Dans Google Analytics vous pouvez voir facilement les mots clés qui ont amenés les utilisateurs sur votre site :

En Octobre 2011, Google a annoncé que ces informations de provenance ne seraient plus transmises pour les utilisateurs qui sont connectés à un compte Google. A la place, serait affiché (not provided) !

Au moment de l’annonce, Google a affirmé qu’en moyenne, les utilisateurs qui ne fourniraient pas ce genre de données ne dépassent pas 10% du trafic depuis les moteurs de recherche, et qu’il ne fallait surtout pas s’inquiéter.

Ce qui est important dans cette affirmation, c’est “en moyenne”. On peut trouver des cas de site dont les (not provided) représentent jusqu’à 50% du trafic !

Là où c’est devenu drôle, c’est quand on a commencé à annoncer toujours plus de gazillions de nouvelles inscriptions Google+. Et oui, un utilisateur Google+, c’est un utilisateur Google, un des fameux (not provided) ! Heureusement, de ce coté là, on est plutôt tranquille.

Bon, et j’en fais quoi de ce (not provided) ?

La règle n°1 du (not provided), c’est de ne pas y penser.

A moins que ça ne représente une part importante de votre trafic, concentrez vous déjà sur les informations que vous possédez.

La règle n°2 du (not provided), c’est de ne pas y penser.

En général, les créateurs d’un site ne se servent des informations sur les mots clés que pour avoir une impression générale de leurs utilisateurs, et ne savent pas comment agir sur la base de ces informations. Du coup, ça ne vaut probablement pas la peine de se fatiguer simplement pour satisfaire une curiosité.

La règle n°3 du (not provided), c’est d’identifier l’information de valeur.

Vous voila avec un gros tas de (not provided) et vous ne savez pas qui ils sont. Élément d’importance : (not provided) regroupe tous les mots clés d’utilisateurs connectés. Ce n’est pas un vrai groupe, mais bien un tas que rien ne relie.

Il va falloir éclater ce tas pour avoir idée de ce qui se cache derrière. Pour ça, il y a une première étape qui permet d’y voir plus clair : croiser (not provided) avec la landing page.

Vous pouvez maintenant facilement différencier les recherches générales (qui arrivent sur la page d’accueil), les campagnes (qui arrivent sur des pages spécialement prévues pour capter le client : les landing pages) ou la long tail (qui arrivent un peu n’importe où sur le site).

Maintenant, vous pouvez vous désintéresser du trafic qui ne vous apporte rien (bounce rate élevé, temps sur la page très court).

Enfin, la dernière étape pour retrouver la valeur et se débarrasser de la malédiction (not provided), c’est de rapprocher vos groupes d’inconnus avec les groupes clairement identifiés (pas les utilisateurs google, donc) et de consolider les données.

La règle n°4 du (not provided), c’est de ne pas y penser.

Le changement est pénible, mais s’il reste effectivement dans des proportions raisonnables et que tout le monde continue à ignorer Google+, la perte d’informations est mineure et ne vous empêchera pas de travailler et de gagner plein de sous grâce à votre connaissance des utilisateurs.

Un mot pour la fin

Google Search, AdWords, AdSense, Analytics... L’hégémonie Google fait que le moindre changement touche la majeure partie des acteurs du web et qu’il y a toujours des victimes.

Les modifications d'algorithme connues sous les noms de Panda et plus récemment Penguin ont eu un très grand impact, mais le but très clairement affiché était de "rendre internet meilleur". Du coup, on râle, mais on comprend.

Sachant que la limitation (Not Provided) n'est pas appliquée pour les clients Google, ceux qui payent des AdWords, on peut sérieusement questionner son intérêt. Cette modification gêne, n'apporte rien et on ne se l'explique pas.

Heureusement, le business du web marketing et du référencement est rempli de gens adaptables, réactifs et fourbes qui retombent toujours sur leurs pieds. Et pour les autres... C’est la sélection naturelle.

Pour aller plus loin

Pourquoi ils ont fait ça, comment ça marche, comment les gens ont réagi et autres ressources :

Techniques un peu plus avancées pour exploiter les données masquées :