Gouvernance SI

ElasticSearch, indexation de contenu (CB021)

- Situer Elasticsearch dans un écosystème Big Data
- Identifier les enjeux et les cas d'utilisation d'un moteur de recherche
- Appréhender le fonctionnement d'ElasticSearch
- Savoir installer et configurer ElasticSearch
- Indexer des volumes importants de données
- Comprendre comment administrer le système et le surveiller afin de garantir sa disponibilité

Diplôme
Certificat Pythagore FD
Durée
2 jours (soit 14 heures)
Coût
1 824 €
Campus
Paris 9ème ou à distance

ElasticSearch, indexation de contenu (CB021)

  • A l’issue de la formation, le stagiaire sera capable de mettre en œuvre une solution de recherche performante de données volumineuses avec ElasticSearch.

Situer Elasticsearch dans un écosystème Big Data

  • Positionnement d'Elasticsearch et des produits complémentaires :Kibana, Logstash, Beats, X-Pack
  • Présentation des concepts clés d'ElasticSearch
  • Atelier : comparaison d'ElasticSearch avec d'autres moteurs d'indexation en fonction du cas d'utilisation

Identifier les enjeux et les cas d'utilisation d'un moteur de recherche

  • Présentation de la pile elastic.
  • Cas d'usage classiques : analyse de logs et securité, analyse de métriques, recherches web, ...
  • Analyse et visualisation de données
  • Principes de base de l'analyse de texte, recherche dans des données structurées, recherche full text,
  • Atelier : choix d'un outil d'indexation en fonction des contraintes d'utilisation

Appréhender le fonctionnement d'ElasticSearch

  • Principe : base technique Lucene et apports d'ElasticSearch. Fonctionnement distribué
  • Concepts clés : index, types, documents, noeuds, clusters, shards et replica
  • Notions de datatypes et mappings
  • Opérations CRUD : exemples d'opérations basiques, création d'index et mappings
  • Atelier : Installation d'une pile Elastic et création d'un index

Savoir installer et configurer ElasticSearch

  • Prérequis techniques. Mode d'installation en grappe distribuée.
  • API RESTful en HTTP . Requêtes avec Search Lite et avec Query DSL (domain-specific language)
  • Atelier : premiers pas dans la console DevTools de Kibana.
  • Indexer des volumes importants de données
  • Format et stockage des données.
  • Conversion au format JSON des données à traiter.
  • Structure des données. Stockage, indexation. Terminologie Elasticsearch : notions de document,index.
  • Métadonnées : _index, _ID
  • Choix de l'identifiant par l'application avec l'API index, ou génération automatique d'un identifiant, ...

Indexation inversée. Outils d'interrogation.

  • Atelier : exemples de requêtes simples et plus complexes : recherche de
  • «phrases», extraction de plusieurs documents, ...
  • Notion de pertinence du résultat : «score»
  • Utilisation de 'filtre' pour affiner des requêtes.
  • Atelier : Mise en oeuvre d'une aggrégation de résultats.
  • Ecriture de requêtes complexes.
  • Notions d'agrégations,
  • Atelier : préparation des données, agrégation de mesures, bucket aggregation.
  • Gestion des accès concurrents
  • Utilisation du numéro de version.
  • Gestion par l'application : différentes méthodes selon les contraintes fonctionnelles.
  • Utilisation d'un numéro de version externe.

Comprendre comment administrer le système et le surveiller afin de garantir sa disponibilité

  • Flux logstash et présentation Kibana
  • Traitement de logs avec logstash
  • Introduction à beats, installation et configuration
  • Supervision du système avec MetricBeat et FileBeat
  • Atelier : recherche, visualisation, création de tableaux de bord et graphiques à partir des données fournies par Elasticsearch

À qui s’adresse cette formation ?

  • Administrateur système, Architectes, Développeurs, Data Analysts et/ou Data Engineers, ...

Pré-requis

  • Disposer de solides bases en administration système Unix/Linux

  • Alternance de théorie et pratique avec une vérification des acquis au fur et à mesure de la formation

  • Après avoir suivi l’ensemble des modules et validé l’obtention du parcours, un Certificat Pythagore FD vous sera remis. 

Pour vous inscrire, envoyez un mail à  formationcontinue@esiee-it.fr  (réponses sous 48heures). 

Informations complémentaires

Texte

Prochaines sessions  : 

  • Du 24 au 25 octobre 2023
  • Du 23 au 24 janvier 2024
  • Du 23 au 24 avril 2024
  • Du 9 au 10 juillet 2024
  • Du 22 au 23 octobre 2024
  • Du 17 au 18 décembre 2024

 

  • Horaires : 9h00 à 17h30
  • Nombre de participants : 4 à 16 par session
  • Possibilité de faire cette formation en 100% distanciel
  • Nouveau programme
  • Si vous êtes en situation de handicap, retrouvez toutes les informations utiles ICI.

 

Contactez-nous