Gouvernance SI

NoSQL : les fondamentaux (CB002)

- Identifier les différences entre SGBD SQL et SGBD NoSQL
- Évaluer les apports et les inconvénients inhérents aux technologies NoSQL
- Identifier les principaux acteurs et solutions du marché pour chaque modèle de données
- Connaître les champs d'application des SGBD NoSQL en opérationnel et en analytique
- Comprendre les différentes architectures, modèles de données et implémentations techniques
- Identifier les critères de choix

Diploma
Certificat Pythagore FD
Duration
1 jour (soit 7 heures)
Cost
1 932 € Net
Campus
Paris 9ème ou à distance

NoSQL : les fondamentaux (CB002)

  • A l’issue de la formation, le stagiaire sera capable d’appréhender de façon opérationnelle les principales caractéristiques des bases de données NoSQL.
     

Identifier les différences entre SGBD SQL et SGBD NoSQL

  • Introduction :
  • origine des bases de données, les notions de transaction,
  • les SGBD, la standardisation SQL,
  • l'arrivée de nouveaux besoins : volumes importants liés aux technologies et aux nouveaux usages,
  • traitements optimisés de flux de données au fil de l'eau.
  • BigData et NoSQL : les 5 V
  • Présentation du Théorème CAP.
  • Développement des techniques sur différents aspects : stockage, indexation/recherche, calcul.
  • Définition ETL : Extract Transform Load.

Évaluer les apports et les inconvénients inhérents aux technologies NoSQL

 

  • Caractéristiques NoSQL.
  • Les familles de bases NoSQL (Clé/valeur,orientées documents, orientées colonnes, graphes)
  • Structure de données proches des utilisateurs, développeurs : sérialisation, tables de hachage, JSON.
  • Priorité au traitement du côté client.
  • Protocoles d'accès aux données, interfaces depuis les langages classiques.
  • Données structurées et non structurées, documents, images,
  • Stockage réparti : réplication, sharding, protocole gossip, hachage,...
  • Parallélisation des traitements : implémentation de map/reduce.
  • Cohérence des données et gestion des accès concurrents : "eventual consistency" et multi-versions concurrency control.

Atelier : démonstration d'un système de stockage réparti avec MongoDB

Identifier les principaux acteurs et solutions du marché pour chaque modèle de données

  • Principaux acteurs
  • Les solutions NoSQL et leurs choix techniques :
  • Redis, MongoDB, Cassandra, HBase (Hadoop), Neo4j, Elasticsearch, ...
  • Les modèles de données de chaque solution.
  • Atelier : démonstrations et tests avec Cassandra, MongoDB, Elasticsearch et HBase.

Connaître les champs d'application des SGBD NoSQL en opérationnel et en analytique

  • Présentation des modes 'opérationnel' et 'analytique'.
  • Notions de données brutes, issues de flux de production, logs, ...
  • et d'analytique : traitement Hadoop, MapReduce, ElasticSearch
  • Etude des étapes de traitement des données : ETL, intégration sqoop
  • Atelier : étude de cas d'applications concrètes des SGBD NoSQL, analyse des données de base, et des possibilités offertes par les solutions NoSQL

Comprendre les différentes architectures, modèles de données et implémentations techniques

  • Etude des points à vérifier :
  • méthode d'utilisation des données, format de stockage JSON, XML, choix de la clé, notion de clé composite, aspects matériels, besoins en mémoire, disques, répartition, ...
  • Import des données : outils et méthodes selon les moteurs NoSQL

Atelier : manipulations sur une base Cassandra pré-chargée et mise en
évidence des points forts et points faibles

Identifier les critères de choix

  • Importance de l'analyse du besoin :
    • types de données à stocker, utilisation de la données, types de traitements, environnement dans lequel s'intègre les données, performances attendues (temps réel, calcul à long terme, flux continu, ...)
  • Critères de choix :
    •  performance,
    •  extensibilité
    •  flexibilité
    •  complexité
  • Positionnement des différents modèles de données pour chacun de ces critères

Atelier : étude d'un cas pratique de choix d'une solution NoSQL pour le stockage de données mise à disposition sur l'infrastructure de travaux pratiques

À qui s’adresse cette formation ?

  • Responsables informatique, chefs de projet, architectes, développeurs, décideurs, ...

Pré-requis

  • Avoir des connaissances de base des architectures techniques, du management SI et des bases de données.

  • Après avoir suivi l’ensemble des modules et validé l’obtention du parcours, un Certificat Pythagore FD vous sera remis. 

Informations complémentaires

Texte

Prochaines sessions  : 

  • Du 11 au 12 octobre 2023
  • Du 13 au 14 décembre  2023
  • Du 7 au 8 mars 2024
  • Du 30 au 31 mai 2024
  • Du 5 au 6 septembre 2024
  • Du 28 au 29 novembre 2024 

 

  • Horaires : 9h00 à 17h30
  • Nombre de participants : 4 à 16 par session
  • Possibilité de faire cette formation en 100% distanciel
  • Nouveau programme
  • Si vous êtes en situation de handicap, retrouvez toutes les informations utiles ICI.

 

Contactez-nous