- Situer Elasticsearch dans un écosystème Big Data
- Identifier les enjeux et les cas d'utilisation d'un moteur de recherche
- Appréhender le fonctionnement d'ElasticSearch
- Savoir installer et configurer ElasticSearch
- Indexer des volumes importants de données
- Comprendre comment administrer le système et le surveiller afin de garantir sa disponibilité
ElasticSearch, indexation de contenu (CB021)
Diplôme
Certificat Pythagore FD
Durée
2 jours (soit 14 heures)
Coût
1 824 €
Campus
Paris 9ème ou à distance
ElasticSearch, indexation de contenu (CB021)
- A l’issue de la formation, le stagiaire sera capable de mettre en œuvre une solution de recherche performante de données volumineuses avec ElasticSearch.
Situer Elasticsearch dans un écosystème Big Data
- Positionnement d'Elasticsearch et des produits complémentaires :Kibana, Logstash, Beats, X-Pack
- Présentation des concepts clés d'ElasticSearch
- Atelier : comparaison d'ElasticSearch avec d'autres moteurs d'indexation en fonction du cas d'utilisation
Identifier les enjeux et les cas d'utilisation d'un moteur de recherche
- Présentation de la pile elastic.
- Cas d'usage classiques : analyse de logs et securité, analyse de métriques, recherches web, ...
- Analyse et visualisation de données
- Principes de base de l'analyse de texte, recherche dans des données structurées, recherche full text,
- Atelier : choix d'un outil d'indexation en fonction des contraintes d'utilisation
Appréhender le fonctionnement d'ElasticSearch
- Principe : base technique Lucene et apports d'ElasticSearch. Fonctionnement distribué
- Concepts clés : index, types, documents, noeuds, clusters, shards et replica
- Notions de datatypes et mappings
- Opérations CRUD : exemples d'opérations basiques, création d'index et mappings
- Atelier : Installation d'une pile Elastic et création d'un index
Savoir installer et configurer ElasticSearch
- Prérequis techniques. Mode d'installation en grappe distribuée.
- API RESTful en HTTP . Requêtes avec Search Lite et avec Query DSL (domain-specific language)
- Atelier : premiers pas dans la console DevTools de Kibana.
- Indexer des volumes importants de données
- Format et stockage des données.
- Conversion au format JSON des données à traiter.
- Structure des données. Stockage, indexation. Terminologie Elasticsearch : notions de document,index.
- Métadonnées : _index, _ID
- Choix de l'identifiant par l'application avec l'API index, ou génération automatique d'un identifiant, ...
Indexation inversée. Outils d'interrogation.
- Atelier : exemples de requêtes simples et plus complexes : recherche de
- «phrases», extraction de plusieurs documents, ...
- Notion de pertinence du résultat : «score»
- Utilisation de 'filtre' pour affiner des requêtes.
- Atelier : Mise en oeuvre d'une aggrégation de résultats.
- Ecriture de requêtes complexes.
- Notions d'agrégations,
- Atelier : préparation des données, agrégation de mesures, bucket aggregation.
- Gestion des accès concurrents
- Utilisation du numéro de version.
- Gestion par l'application : différentes méthodes selon les contraintes fonctionnelles.
- Utilisation d'un numéro de version externe.
Comprendre comment administrer le système et le surveiller afin de garantir sa disponibilité
- Flux logstash et présentation Kibana
- Traitement de logs avec logstash
- Introduction à beats, installation et configuration
- Supervision du système avec MetricBeat et FileBeat
- Atelier : recherche, visualisation, création de tableaux de bord et graphiques à partir des données fournies par Elasticsearch
À qui s’adresse cette formation ?
- Administrateur système, Architectes, Développeurs, Data Analysts et/ou Data Engineers, ...
Pré-requis
- Disposer de solides bases en administration système Unix/Linux
- Alternance de théorie et pratique avec une vérification des acquis au fur et à mesure de la formation
- Après avoir suivi l’ensemble des modules et validé l’obtention du parcours, un Certificat Pythagore FD vous sera remis.
Pour vous inscrire, envoyez un mail à formationcontinue@esiee-it.fr (réponses sous 48heures).
Informations complémentaires
Texte
Prochaines sessions :
- Du 24 au 25 octobre 2023
- Du 23 au 24 janvier 2024
- Du 23 au 24 avril 2024
- Du 9 au 10 juillet 2024
- Du 22 au 23 octobre 2024
- Du 17 au 18 décembre 2024
- Horaires : 9h00 à 17h30
- Nombre de participants : 4 à 16 par session
- Possibilité de faire cette formation en 100% distanciel
- Nouveau programme
- Si vous êtes en situation de handicap, retrouvez toutes les informations utiles ICI.