Cette formation intensive de cinq jours couvre l’ensemble du parcours Machine Learning, de la statistique descriptive aux architectures Deep Learning, en passant par Scikit-learn, TensorFlow, Spark et la visualisation de donnees. Vous apprendrez a developper, optimiser et deployer des modeles ML en conditions reelles, avec un pipeline MLOps complet incluant monitoring et amelioration continue.
Public visé
Toute personne souhaitant acquérir des compétences dans le développement d’applications de Machine Learning et d’IA.
Prérequis
Avoir suivi cette formation, ou en maîtriser les thèmes abordés :
Objectifs pédagogiques
À l’issue de cette formation, les apprenants seront capables de :
- Développer des applications de Machine Learning et d’IA avec Spark et Python
- Utiliser la programmation parallèle sur un cluster
- Développer et optimiser des algorithmes standards de Machine Learning et d’IA
- Utiliser les bibliothèques Python pour le Machine Learning et l’IA
- Décrire le cycle de vie d’un projet Data Science
Programme
Jour 1
Vue d’ensemble du Big Data, du Machine Learning et de l’IA
- Introduction au Big Data et à l’IA (Intelligence Artificielle) : de quoi s’agit-il ?
- Perspectives offertes par le Big Data et l’IA
- Les acteurs du Big Data et de l’IA
- Exemples pratiques
- Les technologies concernées
- Les différents métiers
- Aspects économiques (OPEX, CAPEX, TRI) du Cloud vs On-Premise
- Démonstration d’applications
Rappels sur la Data Science
- Les bases du langage Python
- Modélisation des problématiques grâce à des vecteurs et matrices
- Probabilités, statistiques, statistiques descriptives, statistiques explicatives
- Entropie, gain d’information
- Compromis biais-complexité
- La malédiction de la dimension
- Matrice de confusion
- Gérer les valeurs manquantes MCAR / MAR / MNAR
- Validation croisée
- Courbe d’apprentissage
- Fondamentaux du nettoyage des données
- Réduction de la dimension par sélection de variables et par transformation de variables
- Métriques de performance d’un modèle :
- R²
- Accuracy
- Prrécision et rappel (recall)
- F1-score
- AUC
- P-valeur
Travaux pratiques :
- Chargement, exploration, analyse, nettoyage, et premières modélisations sur un jeu de données
Jour 2
Machine Learning et IA : algorithmes
- Les concepts du Machine Learning et de l’IA
- Les données supervisées ou non supervisées : quelles différences ?
- Les librairies :
- Scikit-learn
- Tensorflow
- PyTorch
- Keras
- Régression
- Modèles linéaires
- Classification
- Naive Bayes
- K-NN
- K-Means clustering
Travaux pratiques :
- Mise en oeuvre des algorithmes vus en fonction de la finalité recherchée (régression, classification, imputation de valeurs manquantes) et en utilisant les librairies Scikit-learn et Keras
Jour 3
Machine Learning et IA : algorithmes (suite)
- DBScan
- Arbres de décision et de régression
- Support Vector Machines (SVM)
- Réseaux de neurones et apprentissage profond (Deep Learning)
- Réseaux convolutifs, réseaux récurrents
Travaux pratiques :
- Modélisations avancées (DL, CNN, RNN) avec optimisation des architectures et hyper-paramètres
Jour 4
Développer avec Spark
- Introduction à Apache Spark
- Faire du Machine Learning avec Apache Spark MLlib
- Traiter les données en temps réel avec Apache Spark Streaming
- Faire des requêtes au format SQL avec Apache Spark SQL
- Modélisation de réseaux sociaux grâce à des graphes avec Apache Spark GraphFrames
- Démonstration du travail collaboratif avec MLFlow
Travaux pratiques :
- Exercices d’application avec Spark MLlib/Streaming/SQL/GraphFrames
- Mise en oeuvre de MLFlow pour comparer les modèles
Jour 5
Outil de visualisation des données (ou Dataviz)
- Définition de la Dataviz
- Les acteurs de la Dataviz
- Principes de la Dataviz
- Exemples d’analyse (sous forme de démo) :
- Bibliothèques de Dataviz de Python
- Tableau Desktop / Public
- Microsoft Power BI
Introduction à MLOps et aux architectures serverless
- Les approches DevOps et GitOps
- Bases de la conteneurisation et de l’automatisation
- Les architectures serverless
- Développer et déployer des applications MLOps en production (démo)
- Monitoring et amélioration continue des applications MLOps (démo)
Travaux pratiques :
- Prise en main de Tableau ou MS Power BI
- Utilisation de librairies Python (Matplotlib, Seaborn)
- Création et exécution d’un pipeline MLOps avec serving et monitoring du modèle
Modalités d’évaluation des acquis
En cours de formation, par des travaux pratiques. En fin de formation, par un questionnaire d’auto-évaluation.
Pour aller plus loin
Cette formation donne accès aux formations suivantes :
Voir aussi
Vous serez peut-être intéressés par les formations suivantes :
- AIOps Foundation
- ChatGPT pour le développement de code
- IA - Analyse et production de code informatique
- Analyse de Données avec l'IA
- IA et outils du Deep Learning
- Claude Code pour le Développeur
- ChatGPT et GPT-4 dans des applications Python
- IA - Génération de Modèles
- IA - Ingénierie et Création de Solutions
- AWS - MLOps Engineering
- IA et traitement d'images
Formation EAI-ML-100 — Apprentissage. Domaine : Intelligence Artificielle. Niveau : Initiation. Durée : 5 jours (35 heures). Mots-clés : machine-learning, intelligence-artificielle, initiation, deep-learning, python, spark. Cylian Formation, Dijon.