En tant qu’utilisateurs avertis de Google Analytics, nous avons mis au point quelques expressions régulières dont le principe nous sert quotidiennement. Bonne nouvelle, le jour est venu de vous en faire profiter !

Ces quelques opérateurs vous permettront de générer un grand nombre de rapports Google Analytics. Ces expressions peuvent également être utilisées pour la création de segments avancés. Ainsi, vous pouvez affiner vos analyses et multiplier les angles de vues sur vos statistiques d’audience.

Notez que les expressions présentées peuvent être appliquées à toutes les dimensions, à savoir : source, support, campagne, groupe d’annonce, mot clé, etc.

Liste des opérateurs

L’opérateur “OU”

Pour illustrer l’utilisation de l’opérateur OU, nous souhaitons isoler dans notre rapport toutes les sources de trafic dont le nom contient soit Google soit Yahoo soit Bing. Pour cela nous utilisons l’expression régulière suivante dans le champ de filtrage de Google Analytics :

  • google|yahoo|bing

Opérateur OU

L’opérateur “ET”

Dans cet exemple, nous souhaitons obtenir toutes les campagnes qui contiennent “astuce” et “google”, quel que soit l’ordre d’utilisation de ces termes, pour cela l’expression adéquat est la suivante :

  • google(.*)astuce|astuce(.*)google

Opérateur ET

L’opérateur “COMMENCE PAR”

Cette fois-ci, nous souhaitons connaître les expressions clés qui commencent par “wagablog”, ainsi nous appliquons l’expression régulière suivante sur le champ d’application mot clé :

  • ^wagablog

Opérateur COMMENCER PAR

L’opérateur “TERMINE PAR”

A l’inverse, nous souhaitons isoler le trafic généré par les mots clés se terminant par “wagablog” :

  • wagablog$

Opérateur TERMINER PAR

L’opérateur “CARACTERE OPTIONNEL”

Dans cet exemple, nous souhaitons connaître les statiques relatives à l’expression composée “valeur personnalisée” au singulier comme au pluriel. Le caractère spécial ‘?’ précise que le caractère qui le précède est optionnel.

  • valeurs? personnalisées?

Opérateur OPTION

L’opérateur “OU dans une chaine de caractère”

Les parenthèses permettent de créer une sous chaine de caractères et de lui appliquer une expression localisée, ainsi, nous pouvons ainsi identifier les expressions “valeur personnalisée” avec ou sans accent :

  • valeurs personnalis(é|e)es

Opérateur OU CHAINE DE CHARACTERE

Exemples avec combinaisons d’opérateurs

Il est possible de créer des expressions  rationnelles complètes en combinant les opérateurs :

Exemple 1

Cet exemple permet de connaitre les statistiques relatives aux mots clés qui commencent par “google” et qui terminent par “analytics”

  • ^google(.*)analytics$

Opérateur COMMENCER PAR ET TERMINER PAR

Exemple 2

La combinaison de l’opérateur “commencer par” et de l’opérateur “terminer par” permet d’isoler les statistiques relatives au mot clé qui correspond exactement à : “wagablog”

  • ^wagablog$

Opérateur COMMENCER TERMINER

Exemple 3

Cet exemple 3 permet de connaître le trafic dont la source de trafic correspond exactement à Google ou Yahoo ou Bing

  • ^google$|^yahoo$|^bing$

Opérateur OU EXACT

Exemples avancés

Exemple sur la gestion de la marque

Lister toutes les combinaisons de fautes d’orthographe et de frappe peut s’avérer fastidieux, ainsi, dans certains cas, nous utilisons, le caractère spécial “point” qui représente n’importe quel caractère.

  • r.son.o

La fonction régulière précédente correspond à toutes ces combinaisons ainsi que beaucoup d’autres :

  • résoneo
  • resonéo
  • résoneo
  • rzsoneo
  • resonzo
  • rzsonzo
  • etc.

Résonéo ne contient pas de Z, mais il est possible que le site soit référencé sur rézoneo et que certains visiteurs fassent cette erreur.
La barre verticale utilisée dans l’expression rationnelle suivante permet de prendre en compte rezoneo dans les rapports.

  • r.(z|s)on.o

Également, Résonéo s’écrit en un seul mot mais le site de l’agence est tout de même positionné sur “reso neo” et “reso-neo”.

  • r.(z|s)o(\s|-)?n.o

En effet,  \s correspond à un séparateur et le point d’interrogation précise que le caractère qui le précède est optionnel.

Voilà, grâce à cette expression régulière nous pouvons ainsi générer un rapport fidèle au trafic de la marque : Résonéo.

Exemple sur la gestion de la longue traine

Dans cet exemple, nous souhaitons connaitre quelles sont les mots clés issus de la longue traine.

Grâce à l’expression régulière suivante, nous pouvons isoler le trafic issu des mots clés ayant au moins 2 mots :

  • [^\s]+\s+[^\s]+

Vous souhaitez 4 mots ou plus? Adaptez cette expression en fonction de vos besoins en ajoutant deux fois \s+[^\s]+ à la fin de l’expression initiale :

  • [^\s]+\s+[^\s]+\s+[^\s]+\s+[^\s]+

Exactement 2 mots clés : on préfixe par ^ (début de chaine) et suffixe par $ (fin de chaine)

  • ^\s*[^\s]+\s+[^\s]+\s*$

Opérateur EXACT DEUX MOTS

Les requêtes marque contenant au moins un mot clé :

  • wagablog\s*[^\s]+|\s*[^\s]+wagablog

Découvrez d’autres articles sur les expressions régulière dans Google Analytics :

http://www.wagablog.com/2008/04/trucs-et-astuces-par-lunametrics/47
(attention à celui ci, les conditions négatives ne sont plus interprétées par Google Analytics au niveau des rapports)
http://www.wagablog.com/2007/08/regrouper-les-webmails/9