Skip to content

ghoff2110/retail_dbt_project

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Welcome to # Projet Retail DBT - Pipeline ETL BigQuery

Description

Ce projet illustre un pipeline ETL simple avec dbt et BigQuery, organisé en plusieurs étapes de transformation pour assurer modularité, qualité, et maintenabilité.


Structure du projet

  • raw_sales : table brute importée manuellement dans BigQuery
  • models/stg_sales.sql : modèle staging, nettoie et prépare les données brutes
  • models/int_sales_metrics.sql : modèle intermédiaire, enrichit les données (ajout colonnes date, prix moyen…)
  • models/fct_sales.sql : modèle final, agrège les données pour produire les KPIs prêts à être utilisés dans un dashboard

Pourquoi cette organisation ?

  • Modularité : découpage clair des transformations pour faciliter la lecture et la maintenance
  • Réutilisabilité : chaque modèle peut être réutilisé dans d’autres pipelines
  • Tests : possibilité de tester la qualité des données à chaque étape
  • Performance : choix de matérialiser certaines étapes pour optimiser les temps de calcul
  • Collaboration : facilite le travail en équipe entre data engineers, analystes, et BI developers

Comment utiliser ce projet

  1. Importer le fichier CSV sales_data.csv dans BigQuery (table raw_sales)
  2. Configurer dbt (profil profiles.yml) avec les accès à BigQuery
  3. Lancer les commandes dbt suivantes :
    dbt debug  
    dbt run  
    dbt test  
    dbt docs generate  
    dbt docs serve  
    

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Languages