Google a annoncé l’arrêt des propriétés Google Universal Analytics pour Juillet 2023 et Universal Analytics 360 pour Octobre 2023. A partir de cette version, les propriétés UA ne remonteront plus de données. Dans le même, Google pousse le marché à adopter la version 4 de son outil de mesure d’audience qui, d’après Google, est plus complète, plus flexible et permettra de répondre dans une certaine mesure aux contraintes de Data Privacy.
Google suggère d’installer dès maintenant Google Analytics 4 et de commencer à remonter de la donnée afin de pouvoir avoir assez d’historique de données en Juillet 2023 :
- Pour éviter les trous de données lorsque vous souhaitez comparer vos données à N-1
- Se familiariser avec l’interface GA4
- Exploiter toute la puissance du nouveau modèle de données ( données user centric ) proposé par GA4.
Toutefois, qu’en est-il de vos données Universal ? Comment effectuer des comparaisons N-2 automatiquement sans avoir besoin de faire des extractions en csv/excel ? Comment consolider les données GA3 et GA4 dans une même base afin de garder une certaine continuité dans les analyses sans rupture, sans avoir besoin de faire des extractions ?
Pour répondre à cette problématique, nous pouvons utiliser un outil de Data Ingestion qui nous permettra d’importer directement dans une base de données ( BigQuery, Snowflake, Redshift, etc) les données Google Analytics historiques. Nous pourrions ensuite combiner ces données et les données GA4 brutes disponibles dans BigQuery pour avoir une vision sans interruption des kpis site centric. Ci dessous le flux que nous souhaitons mettre en place.
Airbyte est un outil d’ingestion de données permettant d’importer vers vos bdd les données provenant plus d’une centaines de sources de données.

1. Configuration de la source GA dans Airbyte
La configuration de la source dans Airbyte est assez simple. Il existe une documentation claire sur le sujet qui vous guidera clairement :

Configurer la source en indiquant :
- Le nom de la source
- La date de début de collecte des données GA
- La vue GA
Les dimensions & Metrics que vous souhaitez importés. Airbyte n’importe pas dans BigQuery les données burtes GA. Il importe les données agrégées ( Sessions, Page vues, Transactions, Revenue, par Source de trafic, par Jour, par Catégorie d’Appareil, etc) a l’image des imports de données qu’on peut faire via l’API Google Analytics via Google SpreadSheet.

2. Configuration fréquence d’importation
Une fois la source configurée, Airbyte permet d’indiquer la fréquence à laquelle les données seront mises à jour. Le choix de la fréquence dépendra de votre problématique, il ne sera potentiellement pas pertinent de définir une fréquence mais un import manuel dans le cas d’une importation en One Shot.

3. Lancement de l’importation
Le lancement de l’importation se fait en quelques clics sur la plateforme. Une vision sur les logs permet de s’assurer du bon déroulement du processus d’import de données vers BigQuery.

5. Données dans BQ et exploitation
Une fois le processus terminé, les données sont désormais disponibles dans BigQuery pour exploitation.

Les données GA3 peuvent être ensuite exploitées via DBT ou via une pipeline pour consolidation avec GA4 pour avoir une vision complète historique des Kpi’s site centric.