Talend Data Integration est l’un des ETL open source les plus utilises pour les echanges de donnees inter-applicatifs et l’alimentation de Data Warehouses. Cette formation de 3 jours vous guide pas a pas dans la prise en main de l’environnement, la creation de jobs et la manipulation des composants essentiels. A l’issue, vous serez capable de concevoir, tester et deployer vos propres flux de donnees.
Public visé
Professionnels de l’informatique et développeurs ayant besoin d’implémenter des flux de données inter-applications ou devant alimenter un entrepôt de données.
Objectifs pédagogiques
À l’issue de cette formation, les apprenants seront capables de :
- Identifier l’environnement de Talend et son fonctionnement
- Préciser la philosophie des ETL (compilation de type ETL ou ELT)
- Créer des flux de données
- Transformer et gérer la donnée
- Identifier et corriger les erreurs
Programme
Jour 1
Introduction
- Définition du besoin
- EAI / ETL
- Échange inter-application
- L’ETL dans un projet décisionnel
- Mise en place de l’outil
- Installation du JDK (kit de développement Java)
- Astuces et remarques (premier démarrage)
L’environnement de développement
- Découverte de l’interface graphique Eclipse
- Écran de démarrage
- Connexion au workspace
- Création d’un projet
- Ouverture d’un projet
- Présentation des éléments d’interface
- Définition des éléments de référentiel projet
- Initiation aux composants
- La palette
- Énumération des grandes familles de composants
Travaux pratiques :
- Générer un fichier Excel avec des données aléatoires et structurer un fichier
Jour 2
Développer les premiers flux
- La modélisation de flux par le Business Model
- Le développement de jobs
- Conventions et règles de développement
tRowGeneratortFileOutputExceltFileInputExceltMsgBoxtSendMail- Lier les composants entre eux
- Exécuter un job
Transformer et gérer les données
tFilterRowtUniqRowtAggregateRowtSortRowtMap
Mise en place et utilisation des métadonnées
- Définition du concept
- Créer une métadonnée Excel
- Utiliser une métadonnée Excel
- Créer une métadonnée de base de données
- Récupérer les informations d’une base de données
Manipuler une base de données avec Talend
- Définition des composants liés aux bases de données
tAccessInput/tMysqlInputtAccessOutput/tMysqlOutput
Notions et composants avancés
- Définition et utilisation des variables globales
tBuffertSystemtServerAlivetUnitetReplicate
Travaux pratiques :
- Créer une métadonnée à l’aide de la base de données sample2007 et récupérer les tables suivantes
Jour 3
Les boucles dans Talend
tFileListtInfiniteLooptLooptPOPtFlowToIterate
Gestion des logs / erreurs
tLogRowtDieettLogCatchertWarntStatCatchertFlowMeterettFlowMeterCatcher
Gestion des environnements et transformations réutilisables
- Définition de la notion de contexte
- Créer une variable de contexte
- Utiliser une variable de contexte
- Modifier une variable de contexte
- Développement et utilisation de routines
Préparation au déploiement de la solution
- Définition et développement d’un séquenceur
- Génération de la documentation du projet
- Construction et automatisation du projet
Travaux pratiques :
- Construire un état des ventes par pays et par mois
- Créer une cascade de jobs
Modalités d’évaluation des acquis
En cours de formation, par des travaux pratiques. En fin de formation, par un questionnaire d’auto-évaluation.
Pour aller plus loin
Cette formation donne accès à cette formation :
Voir aussi
Vous serez peut-être intéressés par les formations suivantes :
- HBase - Base NoSQL Big Data
- Modéliser un système d'information décisionnel
- Oracle Data Integrator
- Talend Niveau 2
Formation EBI-TALEND-100 — Talend Niveau 1. Domaine : Business Intelligence. Niveau : Initiation. Durée : 3 jours (21 heures). Mots-clés : talend, etl, business-intelligence, initiation. Cylian Formation, Dijon.