Lab Analytics Engineering : transforme des données brutes en tables fiables
Pratique le SQL moderne sur des cas data réels : ingestion, transformation, modélisation, tests qualité, SCD, chargements incrémentaux, cohortes et funnels. 106+ exercices progressifs, directement dans ton navigateur.
Module 1 gratuit · Aucune carte bancaire requise · Premier exercice en moins de 2 minutes
Exercices
Modules
Pensé pour les data analysts, analytics engineers et candidats aux certifications data modernes.
Exercice
Module 1 · Étape 6Pour chaque catégorie, retourne le produit avec le plus gros revenu en une seule requête, sans CTE intermédiaire.
Ta requête
1 SELECT category, product, 2 SUM(quantity * unit_price) AS revenue 3 FROM sales 4 GROUP BY category, product 5 QUALIFY ROW_NUMBER() OVER ( 6 PARTITION BY category 7 ORDER BY revenue DESC 8 ) = 1;
Résultat · 3 lignes · 18 ms
| category | product | revenue |
|---|---|---|
| Tech | iPhone 15 | 2 400 |
| Mode | Veste | 180 |
| Beauté | Parfum | 160 |
Dans ce lab, tu apprends les patterns SQL réellement utilisés en analytics engineering : QUALIFY, window functions, SCD, tests qualité, chargements incrémentaux et modélisation.
Un parcours progressif en 12 modules
Tu pars des fondations du SQL moderne, puis tu construis progressivement un vrai workflow d'analytics engineering : ingestion de fichiers, transformation, modélisation, tests qualité, historique, incrémental et analyses produit. Chaque module contient des exercices exécutables dans le navigateur, avec validation automatique et corrections guidées.
Fondations du SQL moderne
SQL moderneÉcrire des requêtes analytiques lisibles avec QUALIFY, GROUP BY ALL, FILTER, EXCLUDE, lambdas et fonctions avancées.
Architecture Medallion : Bronze, Silver, Gold
WarehouseConstruire un warehouse en 3 couches : données brutes, modèles nettoyés, marts prêts pour les dashboards.
Fichiers data : Parquet, CSV et JSON
IngestionCharger, valider et consolider plusieurs sources avec contrôle du schéma.
Window functions avancées
WindowClasser, comparer, dédupliquer et calculer des agrégats glissants entre lignes.
Joins spécialisés
JoinsMaîtriser SEMI, ANTI, ASOF, LATERAL et FULL OUTER JOIN pour la réconciliation data.
JSON et données semi-structurées
JSONManipuler listes, objets imbriqués, STRUCT, LIST, UNNEST et lambdas.
PIVOT, UNPIVOT et reporting
ReportingTransformer lignes et colonnes pour produire des tables adaptées aux rapports.
Modélisation dimensionnelle
ModélisationConstruire des tables de faits et dimensions avec un grain clair et analysable.
Tests et qualité des données
QualitéContrôler unicité, valeurs NULL, fraîcheur, références cassées et anomalies.
Slowly Changing Dimensions
HistoriqueHistoriser les attributs qui changent dans le temps avec des modèles SCD.
Chargements incrémentaux
IncrémentalNe recalculer que les données modifiées, gérer les retards et garder une cible cohérente.
Cohortes, rétention et funnels
ProduitMesurer activation, rétention, conversion et LTV par cohorte.
Tu débutes en SQL ? Commence d'abord par les bases SQL interactives du SQL Lab, puis reviens sur ce parcours quand tu maîtrises SELECT, JOIN et GROUP BY.
Ce que tu sauras faire après le lab
Des compétences directement transférables sur ton job ou ton portfolio.
Pas seulement du SQL : un workflow analytics engineering complet
Aucun chevauchement avec un cours SQL standard. Ici on attaque les patterns utilisés au quotidien dans les warehouses analytiques modernes.
Exercices exécutables dans le navigateur, sans rien installer.
Validation automatique de chaque requête.
Progression par modules, du SQL moderne aux patterns de production.
Cas proches du travail réel : ingestion, transformation, tests, historisation.
Patterns SQL modernes inspirés de Snowflake, BigQuery, Databricks et DuckDB, avec des notes de compatibilité lorsque nécessaire.
Focus sur la fiabilité des données, pas seulement sur la syntaxe.
Compatibilité multi-engine
Patterns SQL modernes inspirés de Snowflake, BigQuery, Databricks et DuckDB, avec des notes de compatibilité lorsque la syntaxe diffère.
ARG_MAX (DuckDB) = MAX_BY (Snowflake / Databricks) = ARRAY_AGG ... LIMIT 1 (BigQuery)
Pour qui est fait ce lab ?
Pour celles et ceux qui veulent dépasser le SQL de débutant et bâtir des données fiables.
Data analysts
qui veulent passer au niveau analytics engineer.
Analytics engineers
qui veulent solidifier leurs bases SQL et modélisation.
Étudiants ou reconversions data
qui veulent pratiquer sur des cas réalistes.
Candidats certifications data modernes
dbt, Snowflake, BigQuery, Databricks, Microsoft Fabric.
Tu prépares une certification ? Le lab est complémentaire de la certification dbt Analytics Engineering et des autres certifications data disponibles sur la plateforme.
Questions fréquentes
Quelle est la différence entre apprendre SQL et apprendre l'analytics engineering ?
Apprendre SQL consiste surtout à savoir interroger des données. L'analytics engineering va plus loin : tu apprends à transformer, tester, historiser et modéliser les données pour produire des tables fiables utilisées par les dashboards, les équipes métier et les analyses produit.
Le lab est-il adapté aux débutants ?
Le lab commence par les fondations du SQL moderne, mais il est surtout conçu pour les personnes qui veulent aller au-delà des bases : data analysts, étudiants data, analytics engineers ou personnes en reconversion ayant une maitrise de SQL.
Dois-je installer un outil ou une base de données ?
Non. Les exercices s'exécutent directement dans le navigateur. Tu écris tes requêtes, tu les exécutes et tu obtiens une validation automatique.
Quels sujets sont couverts ?
Le lab couvre SQL moderne, architecture Bronze/Silver/Gold, fichiers Parquet/CSV/JSON, window functions, joins spécialisés, données semi-structurées, modélisation dimensionnelle, SCD, tests qualité, chargements incrémentaux, cohortes, rétention et funnels.
Est-ce utile pour préparer une certification data ?
Oui, le lab aide à pratiquer des compétences utiles pour plusieurs certifications et rôles data modernes, notamment autour de l'analytics engineering, de la modélisation, de la qualité des données et du SQL avancé.
Prêt à passer au niveau supérieur ?
Le module 1 est gratuit, sans limite de temps. Tu peux aussi t'entraîner sur les bases SQL interactives ou les exercices Python, et voir les tarifs pour débloquer tous les modules.
Commencer le lab gratuitementAucune carte bancaire requise · Premier exercice en moins de 2 minutes