Public visé
Architectes Data, développeurs, Data Scientists, Data Analysts, ingénieurs Data, chefs de projets, IA Product Managers, consultants BI/Big Data.
Prérequis
- Connaissances en systèmes d’information et bases de données
- Notions d’entraînement de modèles ML/IA
Objectifs pédagogiques
À l’issue de cette formation, vous serez capable de :
- Concevoir une plateforme Cloud-native ou hybride pour ML/IA
- Consolider les actifs Data dans une plateforme unique
- Démocratiser l’accès aux données en mode self-service
- Automatiser la prise de décision via pipelines de streaming
- Intégrer des fonctionnalités prédictives et prescriptives à la BI
Programme
Jour 1 - Matin : Fondamentaux des architectures Data
Architectures de référence
- Lambda, Kappa, Data Warehouse vs Data Lake vs Lakehouse vs Data Mesh
- Concevoir une plateforme d’analytiques moderne
- Outils : DVC, MLflow, Airflow, Spark, dbt, Delta Lake, Iceberg, Hudi
- Offres Cloud : Azure, AWS, GCP, Databricks, Snowflake
Jour 1 - Après-midi : Data Warehouse moderne
Architecture d’un Data Warehouse moderne
- On-Premise vs Cloud
- Intégration SI et gouvernance
- Déploiement Cloud et exécution d’analytiques
Jour 2 - Matin : Organisation Data
Développer la Data team
- DADO, DEDO, DSDO
- Frameworks de migration : Prepare/Discover, Assess/Plan, Execute, Optimize
Jour 2 - Après-midi : Data Lake
Architecture d’un Data Lake
- Zonage, gouvernance, self-service, catalogue
- Déploiement Cloud et analytiques
Jour 3 - Matin : Lakehouse
Architecture d’un Lakehouse
- ACID, upserts, Time Travel, Z-Ordering, VACUUM
- Offres Cloud et analytiques BI
Jour 3 - Après-midi : Streaming et perspectives
Architectures de streaming
- ETL/ELT, IoT, temps réel, apprentissage sur streaming
- Perspectives : Data Intelligence, IA Générative
- Databricks Data Intelligence Platform
Modalités d’évaluation des acquis
- En cours de formation, par des études de cas ou des travaux pratiques
- Et, en fin de formation, par un questionnaire d’auto-évaluation