Product Analytics
Blog
GA4 x BigQuery ML : Détecter automatiquement les produits à fort intérêt

GA4 x BigQuery ML : Détecter automatiquement les produits à fort intérêt

Hamis Badarou
September 2, 2023
5 min read

Contexte

Notre client est un retailler parisien dont le site e-commerce connait une forte croissance depuis quelques années. Ce succès est multi factoriel :

  • Une expérience revue à zéro autant en magasin que sur le site e-commerce
  • Un investit accrue dans le digital depuis le Covid-19 , ceci car les ventes magasin se sont reportées naturellement vers le web
  • Des collections plus belles les unes que les unes
  • Une proposition de valeur digne des plus grandes marques parisienne

Chaque collection intègre ) peu près une centaine de produits mis en ligne. Les équipes analysent en détail le comportement des utilisateurs vis à vis des produits :

  • Consultation des fiches produits
  • Ajout au panier
  • Taux de mise au panier , par taille , par couleur , etc
  • Taux de conversion ( Achats / Consultation )

Ceci parce que les équipes ont besoin de gérer de façon efficace le stock online d'une part, d'autre part les enseignements issus de l'analyse des données du Web permettent de piloter la mise en avant des produits en vitrine en magasin.

Pour aller plus loin dans cette analyse comportementale, les équipes souhaitent mettre en place un système capable de les alerter automatique dès qu'il y a une anomalie sur un produit. Noter ici qu'on définit une anomalie comme une hausse brusque ou une baisse brusque du volume de consultations d'une fiche produit.

Solution

Pour permettre aux équipes d'être plus réactives quant aux comportements des utilisateurs vis à vis des produits , nous avons proposé la mise en place d'un système d'alerting via Slack.

Le système basé une modèle de détection d'anomalie , identifie automatiquement les produits sur lesquels on observe les anomalies puis envoie cette liste de 10 produits ainsi que le stock associée en quasi temps réel aux équipes via slack.

Objectif

  • Réduire le temps d'analyse des équipes en leur fournissant automatiquement les insights
  • Permettre aux équipes de se concentrer sur la prise de décision en sélectionnant uniquement les produits dont on observe une anomalie et pour lesquels on a peu ou trop de stock suivant les règles métiers.
  • Permettre aux équipes de se concentrer sur les aspects stratégiques de gestion de stock versus faire des extractions de données des plateformes pour en sortir des insights.

Comment ça marche ?

Un modèle de détection d'anomalie est une technique d'apprentissage automatique qui permet de détecter les anomalies dans un ensemble de données. Il est utilisé pour identifier les données qui se comportent de manière différente ou inhabituelle par rapport à la normale.

Le modèle de détection d'anomalie est entraîné sur un ensemble de données normales afin de pouvoir détecter les données qui en diffèrent. Les anomalies détectées peuvent être des valeurs aberrantes, des erreurs de mesure, des comportements anormaux ou des schémas inattendus.

https://dhi.github.io/tsod/

Les modèles de détection d'anomalie sont utilisés dans de nombreux domaines, tels que la surveillance de la qualité des produits, la détection de fraudes, la détection de cyberattaques et la surveillance des équipements industriels.

Dans le cadre de l'exploitation des données GA4 , on peut utiliser ce type de modèle pour détecter le comportement des internautes vis à vis des produits d'un site e-commerce. Encore une fois BigQuery ML est la solution la plus simple à déployer dans ce cas de part sa flexibilité.

Pour ceci nous pouvons utiliser BigQuery ML pour :

  • Créer un modèle de détection d'anomalie
  • Entrainer le modèle
  • Mettre en production le modèle et l'intégration dans une data pipeline DBT
Création modèle et Entraînement du modèle

Dans BigQuery. on peut voir le graphe d'exécution de la requête avec notamment le temps d'apprentissage qui aura durée 11m21 :

Détection d'anomalie

La requête suivante permet de détecter les anomalies sur les données d'entrainement :

Cette requête va permettre de détecter quotidiennement les produits détectés en tant qu'anomalie. L'output de cette requête peut être stockés dans BigQuery pour des fins de visualisation :

Et voilà , on est désormais capable de détecter automatiquement les changements de tendances sur un ensemble de produit. Dans un autre article, nous vous expliquerons comment créer des alertes vers Slack ou Teams lorsque qu'un changement de  tendance survient sur un produit.

Partagez l'article

Autres articles

Analytics Engineering

Modern Data Stack : Qu'est ce qu'un process ELT

Le processus ELT est fréquemment utilisé pour transférer les données d'une source de données à une autre, utilisé pour intégrer les données de plusieurs sources en une seule vue,
Hamis Badarou
October 27, 2023
5 min read
Analytics Engineering

Modern Data Stack : Hightouch l'outil Reverse ETL solide et efficace

Hightouch offre une grande flexibilité et une personnalisation complète de la plateforme selon les besoins de chaque entreprise.
Linh-Quan HA
October 27, 2023
5 min read
Analytics Engineering

Marketing Modern Data Stack : Funnel.io l'outil d'ingestion des données marketing de référence

Funnel.io est une plateforme d'analyse de données marketing qui permet aux entreprises de collecter des données provenant de divers sources
Hamis Badarou
October 27, 2023
5 min read