Welcome to # Projet Retail DBT - Pipeline ETL BigQuery
Ce projet illustre un pipeline ETL simple avec dbt et BigQuery, organisé en plusieurs étapes de transformation pour assurer modularité, qualité, et maintenabilité.
raw_sales
: table brute importée manuellement dans BigQuerymodels/stg_sales.sql
: modèle staging, nettoie et prépare les données brutesmodels/int_sales_metrics.sql
: modèle intermédiaire, enrichit les données (ajout colonnes date, prix moyen…)models/fct_sales.sql
: modèle final, agrège les données pour produire les KPIs prêts à être utilisés dans un dashboard
- Modularité : découpage clair des transformations pour faciliter la lecture et la maintenance
- Réutilisabilité : chaque modèle peut être réutilisé dans d’autres pipelines
- Tests : possibilité de tester la qualité des données à chaque étape
- Performance : choix de matérialiser certaines étapes pour optimiser les temps de calcul
- Collaboration : facilite le travail en équipe entre data engineers, analystes, et BI developers
- Importer le fichier CSV
sales_data.csv
dans BigQuery (tableraw_sales
) - Configurer dbt (profil
profiles.yml
) avec les accès à BigQuery - Lancer les commandes dbt suivantes :
dbt debug dbt run dbt test dbt docs generate dbt docs serve