Skip links

Comment importer les données Universal Analytics vers BigQuery

Avec l'arrêt de Universal Analytics en 2023, comment consolider les données GA3 et GA4 dans une même base afin de garder une certaine continuité dans les analyses sans rupture , sans avoir besoin de faire des extractions ?

Google a annoncé l’arrêt des propriétés Google Universal Analytics pour Juillet 2023 et Universal Analytics 360 pour Octobre 2023. A partir de cette version, les propriétés UA ne remonteront plus de données. Dans le même, Google pousse le marché à adopter la version 4 de son outil de mesure d’audience qui, d’après Google, est plus complète, plus flexible et permettra de répondre dans une certaine mesure aux contraintes de Data Privacy. 

Google suggère d’installer dès maintenant Google Analytics 4 et de commencer à remonter de la donnée afin de pouvoir avoir assez d’historique de données  en Juillet 2023 : 

  • Pour éviter les trous de données lorsque vous souhaitez comparer vos données à N-1 
  • Se familiariser avec l’interface GA4
  • Exploiter toute la puissance du nouveau modèle de données ( données user centric ) proposé par GA4.

Toutefois, qu’en est-il de vos données Universal ? Comment effectuer des comparaisons N-2 automatiquement sans avoir besoin de faire des extractions en csv/excel ? Comment consolider les données GA3 et GA4 dans une même base afin de garder une certaine continuité dans les analyses sans rupture, sans avoir besoin de faire des extractions ? 

Pour répondre à cette problématique, nous pouvons utiliser un outil de Data Ingestion qui nous permettra d’importer directement dans une base de données ( BigQuery, Snowflake, Redshift, etc) les données Google Analytics historiques. Nous pourrions ensuite combiner ces données et les données GA4 brutes disponibles dans BigQuery pour avoir une vision sans interruption des kpis site centric. Ci dessous le flux que nous souhaitons mettre en place.

Airbyte est un outil d’ingestion de données permettant d’importer vers vos bdd les données provenant plus d’une centaines de  sources de données.

1. Configuration de la source GA dans Airbyte 

La configuration de la source dans Airbyte est assez simple. Il existe une documentation claire sur le sujet qui vous guidera clairement : 

Configurer la source en indiquant : 

  • Le nom de la source 
  • La date de début de collecte des données GA 
  • La vue GA 

Les dimensions & Metrics que vous souhaitez importés. Airbyte n’importe pas dans BigQuery les données burtes GA. Il importe les données agrégées ( Sessions, Page vues, Transactions, Revenue, par Source de trafic, par Jour, par Catégorie d’Appareil, etc) a l’image des imports de données qu’on peut faire via l’API Google Analytics via Google SpreadSheet.

 

2. Configuration fréquence d’importation

Une fois la source configurée, Airbyte permet d’indiquer la fréquence à laquelle les données seront mises à jour. Le choix de la fréquence dépendra de votre problématique, il ne sera potentiellement pas pertinent de définir une fréquence mais un import manuel dans le cas d’une importation en One Shot.

3. Lancement de l’importation

Le lancement de l’importation se fait en quelques clics sur la plateforme. Une vision sur les logs permet de s’assurer du bon déroulement du processus d’import de données vers BigQuery.

5. Données dans BQ et exploitation

Une fois le processus terminé, les données sont désormais disponibles dans BigQuery pour exploitation.

Les données GA3 peuvent être ensuite exploitées via DBT ou via une pipeline pour consolidation avec GA4 pour avoir une vision complète historique des Kpi’s site centric.

Leave a comment

Explore
Drag