Formation Continue développement

Hadoop : l'écosystème (CB030)

Cette formation va vous permettre de faire le point sur les différents éléments de l'écosystème Hadoop et leurs rôles respectifs. 
Vous allez pouvoir comprendre l'architecture des applicatifs hadoop et savoir quels sont les apports et les cas d'usage des solutions hadoop.
 

Diplôme
Certificat Pythagore FD
Durée
1 jour (soit 7 heures)
Coût
900 €
Campus
Paris 9ème ou à distance

Hadoop : l'écosystème

  • Faire le point sur les différents éléments de l'écosystème Hadoop et leurs rôles respectifs.
  • Comprendre l'architecture des applicatifs hadoop et savoir quels sont les apports et les cas d'usage des solutions hadoop.
     

Introduction

  • Rappels sur NoSQL. Le théorème CAP. Historique du projet hadoop.
  • Fonctionnalités : stockage, outils d'extraction, de conversion, ETL, analyse, ... Exemples de cas d'utilisation sur des grands projets.
  • Les principaux composants : HDFS pour le stockage et YARN pour les calculs. 
  • Les distributions et leurs caractéristiques (HortonWorks, Cloudera, MapR, EMR, Apache, ...)

L'architecture

  • Terminologie : NameNode, DataNode, ResourceManager. Rôle et interactions des différents composants.
  • Présentation des outils d'infrastructure : ambari, avro, zookeeper;de gestion des données : pig, oozie, tez, falcon, sqoop, flume;d'interfaçage avec les applications GIS;de restitution et requêtage : webhdfs, hive, hawq, impala, drill, stinger, tajo, mahout, lucene, elasticSearch, kibana
  • Les architectures connexes : spark, cassandra

Exemples interactifs

  • Démonstrations sur une architecture Hadoop multi-noeuds. Mise à disposition d'un environnement pour des exemples de calcul.
  • Atelier : intégration de données avec Flume, calculs map/reduce avec Pig, Hive, et Impala.

Applications

  • Cas d'usages de hadoop. Calculs distribués sur des clusters hadoop.

  • Chefs de projets, développeurs, et toute personne souhaitant comprendre les mécanismes Hadoop et le rôle de chaque composant.

Alternance de théorie et pratique avec une vérification des acquis au fur et à mesure de la formation

  • Après avoir suivi l’ensemble des modules et validé l’obtention du parcours, un Certificat Pythagore FD vous sera remis. 

Pour vous inscrire, envoyez un mail à  formationcontinue@esiee-it.fr  (réponses sous 48heures). 

Informations complémentaires

Texte

Prochaines sessions  : 

  • 31 mars 2023
  • 17 mai 2023
  • 10 juillet 2023
  • 13 octobre 2023

 

  • Horaires : 9h00 à 17h30
  • Nombre de participants : 4 à 16 par session
  • Possibilité de faire cette formation en 100% distanciel
  • Nouveau programme
  • Si vous êtes en situation de handicap, retrouvez toutes les informations utiles ICI.

 

Contactez-nous

>