La formation Talend : intégration de données vous permet de :
- Maîtriser Talend dans un environnement Big Data
- Se servir de Talend comme lien entre les fichiers, applications et bases de données
- Acquérir la philosophie de l'outil
- Adopter des bonnes pratiques et concevoir des Systèmes d’informations flexibles et robustes
- Être capable d'implémenter ses Jobs
- Lire et écrire des données sur HDFS et dans des bases de données NoSQL avec des Jobs Talend
- Réaliser des Jobs de transformation à l'aide de Pig et Hive
- Gérer la qualité de la donnée avec Talend
- Utiliser Sqoop pour faciliter la migration de bases de données relationnelles dans Hadoop
- Maîtriser l'utilisation de la bibliothèque de composants
- Effectuer des traitements ETL (Extraction, Transform and Load) simple et complexes de bout en bout.
Talend : intégration de données (CB060)
Diplôme
Certificat ESIEE-IT
Durée
3 jours (soit 21 heures)
Coût
2 808 €
Campus
Paris 9ème ou à distance
Talend : intégration de données
- Maîtriser Talend dans un environnement Big Data
- Se servir de Talend comme lien entre les fichiers, applications et bases de données
- Acquérir la philosophie de l'outil
- Adopter des bonnes pratiques et concevoir des Systèmes d’informations flexibles et robustes
- Être capable d'implémenter ses Jobs
- Lire et écrire des données sur HDFS et dans des bases de données NoSQL avec des Jobs Talend
- Réaliser des Jobs de transformation à l'aide de Pig et Hive
- Gérer la qualité de la donnée avec Talend
- Utiliser Sqoop pour faciliter la migration de bases de données relationnelles dans Hadoop
- Maîtriser l'utilisation de la bibliothèque de composants
- Effectuer des traitements ETL (Extraction, Transform and Load) simple et complexes de bout en bout.
Acquérir la philosophie de l'outil
- Augmenter les attentes en matière de gestion des données.
- Rappels sur les solutions ETL.
- Ecosystème Talend : Data integration, big data, realtime big datas, data fabric. Intégration, intégrité et gouvernance des données dans une seule et même plateforme unifiée.
- Présentation de TMC (talend management cloud).
- Présentation Talend OpenStudio : installation, configuration des préférences utilisateurs. Documentation.
- Concevoir des jobs simples avec Talend OpenStudio.
- Comprendre le fonctionnement de Talend : schéma et propagation de schémas au travers de composants, flux de composants
Se servir de Talend comme lien entre les fichiers, applications et bases de données
- Intégrer les liens avec les bases de données : présentation des bases de données supportées.
- Opérations sur les tables, connexion à un schéma de bases de données.
- Gérer les transactions
- Utilisation de SQLBuilder pour créer des requêtes
- Atelier : réaliser une transformation d'un fichier plat vers une table SQL
Maîtriser l'utilisation de la bibliothèque de composants
- Utiliser le Designer, la palette. Zoom sur les composants.
- Tour d'horizon des différentes familles de composants
- Atelier : mise en œuvre des composants jointures, tests, associations, multi-sorties
- Création d'un composant. Paramétrage d'un composant. Création de liaison "Main".
- Atelier : mise en œuvre des composants tFileInputDelimited et tMap.
Être capable d'implémenter ses Jobs
- Création d'un job. Création dans le référentiel.
- Analyse du code et exécution des jobs.
- Optimiser les jobs, utilisation des joblets
- Utilisation des métadonnées, import/export, propagation sur les jobs, configuration de connexions réutilisables
- Utiliser des contextes. Exploiter le composant tContextLoad
- Gérer le traitement des jobs : les composants tPreJob et tPostJob. Recherche de jobs.
- Activer/désactiver un élément.
- Importer/exporter un élément
- Atelier : création d'un flux à embranchements multiples avec exploitation du composant tRunIf
Gérer la qualité de la donnée avec Talend.
- Mise en œuvre des principales connexions.
- Intégration de fichiers XML, CSV et JSON. Filtrer et orienter la donnée avec le composant regex.
- Etude des composants de transformation.
- Les composants tAddCRCRow, tChangeFileEncoding, tUniqueRow et tIntervalMatch.
- Normaliser la donnée avec tNormalize
- Atelier : création d'un flux de transformation de données et enrichissement.
Adopter des bonnes pratiques et concevoir des Systèmes d’informations flexibles et robustes
- Modélisation des applications.
- Présentation des outils : Business Modeler, JobDesigner
- Partager avec les équipes une vue non technique des besoins en terme de flux, opérations, gouvernance des données.
- Atelier : création d'un modèle à partir de diagrammes fonctionnels retraçant les fonctionnalités à prendre en compte, à implémenter dans le projet, développement réalisés par les Jobs.
Maîtriser Talend dans un environnement Big Data
- Intégration de Talend dans un environnement Hadoop. Parallélisation des tâches.
- Comprendre les mécanismes BigData dans la suite Talend. Dénormalisation BigData et normalisation SGBD.
- Présentation des composants BigData, connexion HDFS, mappage et stockage HDFS.
- Les composants BigData disponibles.
À qui s’adresse cette formation ?
Consultants BI, Architectes, Chefs de projets, Gestionnaires de données ou toute personne devant gérer des flux de données.
Quels sont les prérequis ?
Maîtrise des SGBDR et de SQL.
Méthodes pédagogiques
- Apports théoriques suivis d’applications
- Travaux pratiques réalisés
Méthodes d'évaluations
- QCM d'évaluation des acquis
- À l’issue de cette formation, un certificat ESIEE-IT vous sera délivré.
Pour vous inscrire, envoyez un mail à formationcontinue@esiee-it.fr (réponses sous 48heures).
Informations complémentaires
Texte
Prochaines sessions :
- Du 13 au 15 novembre 2023
- Du 11 au 13 mars 2024
- Horaires : 9h00 à 17h30
- Taux de réussite : nouvelle formation
- 100% à distance (D) ou en présentiel (P)
- Si vous êtes en situation de handicap, retrouvez toutes les informations utiles ICI