formation-continue

Talend : intégration de données (CB060)

La formation Talend : intégration de données vous permet de : 
- Maîtriser Talend dans un environnement Big Data
- Se servir de Talend comme lien entre les fichiers, applications et bases de données
- Acquérir la philosophie de l'outil
- Adopter des bonnes pratiques et concevoir des Systèmes d’informations flexibles et robustes
- Être capable d'implémenter ses Jobs
- Lire et écrire des données sur HDFS et dans des bases de données NoSQL avec des Jobs Talend
- Réaliser des Jobs de transformation à l'aide de Pig et Hive
- Gérer la qualité de la donnée avec Talend
- Utiliser Sqoop pour faciliter la migration de bases de données relationnelles dans Hadoop
- Maîtriser l'utilisation de la bibliothèque de composants
- Effectuer des traitements ETL (Extraction, Transform and Load) simple et complexes de bout en bout.
 

Diplôme
Certificat ESIEE-IT
Durée
3 jours (soit 21 heures)
Coût
2 808 €
Campus
Paris 9ème ou à distance

Talend : intégration de données

  • Maîtriser Talend dans un environnement Big Data
  • Se servir de Talend comme lien entre les fichiers, applications et bases de données
  • Acquérir la philosophie de l'outil
  • Adopter des bonnes pratiques et concevoir des Systèmes d’informations flexibles et robustes
  • Être capable d'implémenter ses Jobs
  • Lire et écrire des données sur HDFS et dans des bases de données NoSQL avec des Jobs Talend
  • Réaliser des Jobs de transformation à l'aide de Pig et Hive
  • Gérer la qualité de la donnée avec Talend
  • Utiliser Sqoop pour faciliter la migration de bases de données relationnelles dans Hadoop
  • Maîtriser l'utilisation de la bibliothèque de composants
  • Effectuer des traitements ETL (Extraction, Transform and Load) simple et complexes de bout en bout.
     

Acquérir la philosophie de l'outil

  • Augmenter les attentes en matière de gestion des données.
  • Rappels sur les solutions ETL.
  • Ecosystème Talend : Data integration, big data, realtime big datas, data fabric. Intégration, intégrité et gouvernance des données dans une seule et même plateforme unifiée.
  • Présentation de TMC (talend management cloud).
  • Présentation Talend OpenStudio : installation, configuration des préférences utilisateurs. Documentation.
  • Concevoir des jobs simples avec Talend OpenStudio.
  • Comprendre le fonctionnement de Talend : schéma et propagation de schémas au travers de composants, flux de composants

Se servir de Talend comme lien entre les fichiers, applications et bases de données

  • Intégrer les liens avec les bases de données : présentation des bases de données supportées.
  • Opérations sur les tables, connexion à un schéma de bases de données.
  • Gérer les transactions
  • Utilisation de SQLBuilder pour créer des requêtes
  • Atelier : réaliser une transformation d'un fichier plat vers une table SQL

Maîtriser l'utilisation de la bibliothèque de composants

  • Utiliser le Designer, la palette. Zoom sur les composants.
  • Tour d'horizon des différentes familles de composants
  • Atelier : mise en œuvre des composants jointures, tests, associations, multi-sorties
  • Création d'un composant. Paramétrage d'un composant. Création de liaison "Main".
  • Atelier : mise en œuvre des composants tFileInputDelimited et tMap.

Être capable d'implémenter ses Jobs

  • Création d'un job. Création dans le référentiel.
  • Analyse du code et exécution des jobs.
  • Optimiser les jobs, utilisation des joblets
  • Utilisation des métadonnées, import/export, propagation sur les jobs, configuration de connexions réutilisables
  • Utiliser des contextes. Exploiter le composant tContextLoad
  • Gérer le traitement des jobs : les composants tPreJob et tPostJob. Recherche de jobs.
  • Activer/désactiver un élément.
  • Importer/exporter un élément
  • Atelier : création d'un flux à embranchements multiples avec exploitation du composant tRunIf

Gérer la qualité de la donnée avec Talend.

  • Mise en œuvre des principales connexions.
  • Intégration de fichiers XML, CSV et JSON. Filtrer et orienter la donnée avec le composant regex.
  • Etude des composants de transformation.
  • Les composants tAddCRCRow, tChangeFileEncoding, tUniqueRow et tIntervalMatch.
  • Normaliser la donnée avec tNormalize
  • Atelier : création d'un flux de transformation de données et enrichissement.

Adopter des bonnes pratiques et concevoir des Systèmes d’informations flexibles et robustes

  • Modélisation des applications.
  • Présentation des outils : Business Modeler, JobDesigner
  • Partager avec les équipes une vue non technique des besoins en terme de flux, opérations, gouvernance des données.
  • Atelier : création d'un modèle à partir de diagrammes fonctionnels retraçant les fonctionnalités à prendre en compte, à implémenter dans le projet, développement réalisés par les Jobs.

Maîtriser Talend dans un environnement Big Data

  • Intégration de Talend dans un environnement Hadoop. Parallélisation des tâches.
  • Comprendre les mécanismes BigData dans la suite Talend. Dénormalisation BigData et normalisation SGBD.
  • Présentation des composants BigData, connexion HDFS, mappage et stockage HDFS.
  • Les composants BigData disponibles.
     

À qui s’adresse cette formation ?

Consultants BI, Architectes, Chefs de projets, Gestionnaires de données ou toute personne devant gérer des flux de données.
 

Quels sont les prérequis ? 

Maîtrise des SGBDR et de SQL. 
 

Méthodes pédagogiques 

  • Apports théoriques suivis d’applications 
  • Travaux pratiques réalisés 
     

Méthodes d'évaluations

  • QCM d'évaluation des acquis

  • À l’issue de cette formation, un certificat ESIEE-IT vous sera délivré.

Pour vous inscrire, envoyez un mail à formationcontinue@esiee-it.fr  (réponses sous 48heures). 

Informations complémentaires

Texte

Prochaines sessions : 

  • Du 13 au 15 novembre 2023
  • Du 11 au 13 mars 2024
  • Horaires : 9h00 à 17h30
  • Taux de réussite : nouvelle formation 
  • 100% à distance (D) ou en présentiel (P)
  • Si vous êtes en situation de handicap, retrouvez toutes les informations utiles  ICI

 

Contactez-nous