Apache HBase est la base de donnees NoSQL de reference pour le stockage massif de donnees dans l’ecosysteme Hadoop. Cette formation de 2 jours vous permet de maitriser son architecture distribuee, la modelisation orientee colonnes et les operations courantes. Vous repartirez avec les competences necessaires pour deployer et administrer un cluster HBase en environnement de production Big Data.
Public visé
Développeurs, architectes et administrateurs de données souhaitant maîtriser la base de données NoSQL Apache HBase dans un contexte Big Data.
Objectifs pédagogiques
À l’issue de cette formation, les participants seront capables de :
- Comprendre l’architecture et les concepts de HBase
- Installer et configurer un cluster HBase
- Modéliser des données pour HBase
- Effectuer des opérations CRUD avec l’API Java et le shell HBase
- Administrer et optimiser un cluster HBase
Programme
Jour 1
Introduction à HBase
- Positionnement dans l’écosystème Hadoop
- Architecture de HBase : RegionServer, Master, ZooKeeper
- Modèle de données : tables, familles de colonnes, cellules
- Comparaison avec les bases de données relationnelles
Installation et configuration
- Modes de déploiement : standalone, pseudo-distribué, distribué
- Configuration de HBase
- Intégration avec HDFS et ZooKeeper
Modélisation des données
- Conception de schémas pour HBase
- Stratégies de clés de lignes (row keys)
- Bonnes pratiques de modélisation
Jour 2
Opérations sur les données
- Utilisation du shell HBase
- API Java pour HBase
- Opérations : Put, Get, Scan, Delete
Administration et monitoring
- Outils d’administration
- Compaction et split de régions
- Sauvegarde et restauration
Optimisation et performance
- Tuning de la JVM et de HBase
- Stratégies de cache
- Bonnes pratiques de production
Modalités d’évaluation des acquis
En cours de formation, par des travaux pratiques. En fin de formation, par un questionnaire d’auto-évaluation.
Voir aussi
Vous serez peut-être intéressés par les formations suivantes :
Formation EBI-HBASE-100 — HBase - Base NoSQL Big Data. Domaine : Business Intelligence. Niveau : Initiation. Durée : 2 jours (14 heures). Mots-clés : hbase, big-data, hadoop, nosql. Cylian Formation, Dijon.