Comment démarrer avec Regex
Publié: 2021-07-21Regex est l'une des compétences techniques qui est souvent négligée dans l'espace marketing. Il peut être utilisé dans Google Search Console, Google Analytics et Google Data Studio pour l'extraction de données pour le référencement.
Cet article est entièrement axé sur le concept de Regex et son avantage à tirer parti de l'analyse des données dans le cadre des services de référencement.
La science des données et l'analyse des données ont un rôle énorme dans l'avenir de l'optimisation des moteurs de recherche. Dans la pratique actuelle, nous ne pouvons pas compter uniquement sur le référencement sur page, hors page et technique.
Le référencement des données joue un rôle énorme dans l'obtention du résultat souhaité du classement des mots clés et du trafic organique.
Regex aide à extraire des modèles spécifiques de caractères à partir d'ensembles de données, ce qui est une compétence très importante pour de nombreux acteurs de l'espace SEO :
- Spécialistes du référencement
- Opérateurs Web et équipe d'analyse Web
- Chercheurs/Ingénieurs de données
- Experts/Consultants en marketing numérique
Qu'est-ce que l'expression régulière ?
Regex, communément appelé expressions régulières, est l'un des outils utilisés pour la correspondance de modèles. Un Regex est une chaîne, ou une série de caractères, qui représente un modèle afin de faire correspondre, gérer et filtrer les textes.
Une chaîne Regex pourrait ressembler à ceci :
([0-9]+(\.[0-9]*) ?)
Il utilise des ensembles de caractères, de symboles et d'autres éléments pour décrire un modèle. Un modèle peut être un numéro de téléphone, une URL, une date ou une heure, une adresse, un identifiant tel qu'une référence de produit ou même une phrase de texte dans une page de code.
Vous pouvez ensuite trouver les séquences dans n'importe quel texte ou liste qui correspondent au modèle que vous avez décrit.
[Étude de cas] Améliorer les classements, les visites organiques et les ventes grâce à l'analyse des fichiers journaux
Comment Regex est-il utilisé dans le référencement ?
Dans les pratiques de référencement, cela aide à filtrer les mots-clés ou les phrases par lesquelles un site Web génère du trafic. À son tour, ce filtre aide à analyser le comportement et l'intention de recherche de vos utilisateurs. Cela est devenu de plus en plus important depuis la mise à jour BERT du moteur de recherche Google, qui a aidé Google à mieux identifier l'intention des utilisateurs à l'aide du NLP.
Après cela, les moteurs de recherche se concentrent désormais sur la compréhension de l'intention de l'utilisateur et classent le contenu le plus convaincant sur la 1ère page du SERP. Google Analytics et Google Search Console sont deux outils gratuits largement utilisés dans le référencement qui prennent en charge l'utilisation de la technologie Regex.
Compétences Regex de base : Opérateurs
Avant d'aller plus loin, vous devez comprendre les opérateurs pour utiliser efficacement Regex. Les opérateurs Regex sont divisés en cinq catégories :
- Jeux de caractères
- Caractères génériques
- Ancres
- Groupes
- Caractères d'échappement
Chaque opérateur représente un type de caractère ou une instruction. Voici quelques-uns des principaux opérateurs.
Classes de personnages
Les classes de caractères sont des ensembles ou des types de caractères.
- \d - Il correspond à n'importe quel chiffre.
- \D - Il correspond à n'importe quel caractère qui n'est pas un chiffre.
- \w - Il correspond à n'importe quel "caractère de mot" (lettres, chiffres, trait de soulignement).
- \s - Il correspond à n'importe quel espace blanc (espaces, tabulations, …).
- \S - Il correspond à tout caractère qui n'est pas un espace.
- ?-i – Spécifie des correspondances sensibles à la casse pour tous les caractères suivants.
Caractères génériques
Les caractères génériques ne spécifient pas le caractère spécifique auquel ils correspondent.
- Point (.) - Il correspond à n'importe quel caractère unique (une lettre, un chiffre ou un symbole).
- Point d'interrogation (?) - Il correspond au caractère précédent 0 ou 1 fois.
- Signe plus (+) - Il aide à faire correspondre le caractère précédent 1 ou plusieurs fois.
- Astérisque (*) - Il aide à faire correspondre le caractère précédent 0 fois ou plus.
- Pipe (|) – Crée une correspondance OR.
Ancres
Les ancres décrivent la partie du motif que vous essayez de faire correspondre.
- Caret (^) - Il indique que le Regex doit correspondre aux caractères au début de la chaîne ou de la ligne, plutôt qu'à n'importe où dans la chaîne.
- Signe dollar ($) - Il indique que le Regex doit correspondre aux caractères à la fin de la chaîne ou de la ligne, plutôt qu'à n'importe où dans la chaîne.
Groupes
Les groupes sont des moyens de regrouper des éléments dans le Regex.
- Parenthèses (()) - Il "capture" les caractères entre parenthèses, qui peuvent être décrits par le motif qui les entoure, correspondant au reste de la Regex. Vous pouvez utiliser plusieurs groupes de capture, et ils seront identifiés dans l'ordre dans lequel ils apparaissent.
- Crochets ([]) - Il correspond à l'ensemble de caractères inclus dans n'importe quel ordre, n'importe où dans une chaîne.
- Tiret (-) - Il est utilisé entre crochets pour indiquer une plage de caractères, comme 0-9 ou AZ.
Échapper
Le caractère d'échappement permet d'utiliser littéralement un caractère même s'il est généralement interprété comme un opérateur.

- Barre oblique inverse (\) – Indique que le caractère adjacent doit être interprété littéralement plutôt que comme un opérateur Regex.
Examinons maintenant quelques exemples de base de son utilisation dans Google Analytics et Google Search Console.
Comment filtrer les tableaux dans Google Analytics
Google Analytics est l'un des outils gratuits qui aide à analyser le parcours de l'utilisateur sur votre site Web à l'aide de données telles que :
- Public : informations démographiques
- Acquisition : comment l'utilisateur est arrivé sur votre site
- Comportement : ce que fait l'utilisateur sur votre site
- Conversion : si l'utilisateur atteint les objectifs de vente ou de marketing que vous lui avez fixés sur votre site
Nous pouvons utiliser Regex pour filtrer les données dans Google Analytics et comprendre le comportement de l'utilisateur.
Dans l'image ci-dessus, la Regex /ebooks/|/tools/
est utilisée pour filtrer deux pages sur 1000 pages sur le site Web à l'aide du |(pipe), qui signifie "ou". Cette chaîne peut être lue comme suit : "Rechercher uniquement les pages contenant soit /ebooks/ soit /tools/
De la même manière, vous pouvez utiliser toutes les autres chaînes pour devenir un maître dans l'art de discerner le comportement des utilisateurs et les pages qu'ils visitent sur votre site Web.
Comment filtrer les requêtes dans Google Search Console
Google Search Console est l'un des outils importants comme Google Analytics. Il fournit des informations sur la façon dont Google utilise les pages dans les résultats de recherche, diagnostique les problèmes en termes de référencement technique et ajoute de la valeur en obtenant des données liées au comportement des utilisateurs.
Récemment, Google Search Console a ajouté la fonctionnalité "Regex" en avril 2021 pour améliorer le filtrage des données à un niveau avancé. Vous pouvez filtrer les modèles qui :,
- Faire correspondre une expression régulière
- Ne correspond pas à une Regex
Il existe de nombreuses installations offertes par GSC, parmi lesquelles le rapport de performance se démarque. Ici, nous pouvons trouver des informations telles que:
- Nombre total de clics
- Impressions totales
- CTR moyen
- Position moyenne
- Requêtes (mots clés jusqu'à 1 000)
- Pages classées
- Des pays
- Dispositifs
- Apparence de la recherche
- Rendez-vous
Tout en haut du rapport, il y a des options de filtrage. Pour utiliser Regex, vous devez cliquer sur l'option "+ Nouveau".
Vous utilisez Regex pour filtrer les requêtes, les pages, les pays, les appareils et l'apparence de la recherche.
Voici un exemple de base de filtrage pour la phrase "agence numérique", "agence numérique" ou des phrases avec un autre texte entre numérique et agence (comme "agence de communication numérique" et "quelle est l'expertise numérique d'une agence SEO") en utilisant l' digital.+agency
:
Voici les résultats:
Pourquoi utiliser Regex ?
Bien que vous deviez d'abord apprendre le concept de chaînes et d'opérateurs, Regex peut être un nouvel outil utile pour de nombreux praticiens du référencement. Regex peut aider à identifier l'intention de recherche, l'analyse de contenu, le comportement de l'utilisateur, etc.
L'avenir du référencement dépend des données et de la compréhension des problèmes techniques avec un effet immédiat qui doivent être résolus.
Il existe de nombreux outils qui utilisent le filtrage des données pour fournir plus d'informations sur n'importe quel site Web. Cela peut inclure Ahrefs et SEMrush, et des crawlers comme Oncrawl, mais aussi des outils comme Google Analytics et Google Search Console.
Lors de l'utilisation de Regex, il est nécessaire de comprendre les opérateurs et les caractères. Ensuite, les méthodologies pour en tirer profit seront claires. L'utilisation de filtres Regex nous aidera à comprendre les données disponibles pour déterminer l'intention de recherche et nous concentrer sur les requêtes de recherche qui amènent les utilisateurs sur votre site Web.
Oui, l'objectif du référencement est d'obtenir du trafic et des mots-clés de classement en premier. Mais la priorité absolue est d'obtenir plus de conversions et de ventes. Regex peut vous aider à transformer votre site Web en une machine de conversion.