L’écosystème scientifique de Python (NumPy, Pandas, SciPy, Matplotlib) est devenu incontournable pour l’analyse de données dans l’industrie et la recherche. Cette formation vous apprend à manipuler des jeux de données, réaliser des calculs complexes et produire des visualisations exploitables dans un environnement Jupyter. Elle s’adresse aux ingénieurs, scientifiques et analystes qui veulent exploiter Python pour leurs traitements de données.
Public visé
Ingénieurs, développeurs, scientifiques, enseignants ou toute personne souhaitant se former sur les calculs scientifiques avec Python.
Prérequis
Avoir suivi cette formation, ou en maîtriser les thèmes abordés :
Objectifs pédagogiques
À l’issue de cette formation, vous serez capable de :
- Créer et paramétrer votre environnement de travail Python scientifique
- Reconnaître l’écosystème scientifique de Python
- Analyser vos données avec NumPy, Pandas et SciPy
- Visualiser vos données avec Matplotlib et Pandas
Programme
Introduction
- situer l’écosystème scientifique Python — NumPy, Pandas, SciPy, Matplotlib
- préparer un environnement de travail Jupyter
NumPy
- comprendre l’intérêt de NumPy pour le calcul vectorisé
- remplacement des listes Python natives
- organisation mémoire contiguë et performance
- interopérabilité avec l’écosystème scientifique
- créer et manipuler des tableaux
- constructeurs —
np.array,zeros,arange,linspace - indexation et slicing
- reshape et transposition
- constructeurs —
- exploiter le broadcasting et les fonctions universelles
- filtrer et agréger des données
- masques booléens
- fonctions de réduction —
sum,mean,std - extraction d’informations significatives
- persister les tableaux — chargement / sauvegarde
np.load,np.save, formats.npy/.npz - structurer des données hétérogènes avec les tableaux structurés
Pandas
- modéliser des données avec les structures Pandas
Seriespour les séquences indexéesDataFramepour les tableaux 2D- index, labels et types
- importer et exporter des données — CSV, Excel, JSON, Parquet
- sélectionner et indexer
- accès par label via
loc - accès par position via
iloc - filtrage conditionnel
- accès par label via
- traiter les données manquantes et réaliser les opérations simples
- pousser le traitement des données
- agrégations avec
groupby - pivot et reshape
- jointures —
merge,join,concat
- agrégations avec
- manipuler des
MultiIndex - travailler sur les chaînes de caractères et les expressions régulières
- traiter des données temporelles —
DatetimeIndex, resampling, offsets - choisir une stratégie pour les données massives — chunking, Dask, PyArrow
Matplotlib et Pandas plot
Matplotlib
- choisir entre les interfaces
- interface MATLAB —
plt.plot,plt.xlabel - interface orientée objet —
fig, ax = plt.subplots()
- interface MATLAB —
- créer des graphiques 2D
- graphique linéaire
- nuage de points
- histogramme
- composer plusieurs graphiques sur une figure
- explorer la 3D avec
Axes3D - interagir avec les graphiques dans un notebook Jupyter
- personnaliser graduations et axes
Pandas plot
- produire des graphiques directement depuis un
DataFrameou uneSeries
SciPy
- réaliser des calculs scientifiques avancés
- intégration numérique —
scipy.integrate - algèbre linéaire —
scipy.linalg - transformée de Fourier —
scipy.fft - interpolation —
scipy.interpolate - ajustement de courbe —
scipy.optimize.curve_fit
- intégration numérique —
Modalités pédagogiques
Formation en présentiel ou distanciel. Alternance entre méthodes démonstrative, interrogative et active avec travaux pratiques.
Modalités d’évaluation des acquis
Par exercices pratiques de programmation en cohérence avec les objectifs du programme.
Voir aussi
Vous serez peut-être intéressés par les formations suivantes :
- Python - Initiation
- Web scraping avec Python
- Data Science avec Python (Scikit-learn)
- Python pour tests d'intrusion
- Python - Perfectionnement
Formation DEV-PYTHON-300 — Python - Calculs Scientifiques. Domaine : Développement. Niveau : Avancé. Durée : 3 jours (21 heures). Mots-clés : python, développement, avancé, data-science, numpy, pandas, scipy, matplotlib. Cylian Formation, Dijon.