La formation Spark MLM va vous permettre de savoir mettre en œuvre les outils de Machine Learning sur Spark, de savoir créer des modèles et les exploiter.

Diploma
Certificat Pythagore FD
Duration
2 jours (soit 14 heures)
Cost
1 932 €
Campus
Paris 9ème ou à distance

Spark ML

  • Savoir mettre en oeuvre les outils de Machine Learning sur Spark, savoir créer des modèles et les exploiter.
     

Introduction

  • Rappels sur Spark : principe de fonctionnement, langages supportés.

DataFrames

  • Objectifs : traitement de données structurées. L'API Dataset et DataFrames
  • Optimisation des requêtes. Mise en oeuvre des Dataframes et DataSet.
  • Chargement de données, pré-traitement : standardisation, transformations non linéaires, discrétisation
  • Génération de données.

Traitements statistiques de base

  • Introduction aux calculs statistiques. Paramétrisation des fonctions.
  • Applications aux fermes de calculs distribués. Problématiques induites. Approximations. Précision des estimations.
  • Exemples sur Spark : calculs distribués de base : moyennes, variances, écart-type, asymétrie et aplatissement (skewness/kurtosis)

Machine Learning

  • Apprentissage automatique : définition, les attentes par rapport au Machine Learning
  • Les valeurs d'observation, et les variables cibles. Ingénierie des variables.
  • Les méthodes : apprentissage supervisé et non supervisé. Classification, régression.
  • Fonctionnalités : Machine Learning avec Spark, algorithmes standards, gestion de la persistence, statistiques.
     

Mise en oeuvre sur Spark

  • Mise en oeuvre avec les DataFrames.
  • Algorithmes : régression linéaire, k-moyennes, k-voisins, classification naïve bayésienne, arbres de décision,
  • forêts aléatoires, etc ...
  • Création de jeux d'essai, entraînement et construction de modèles.
  • Prévisions à partir de données réelles.
  • Atelier : régression logistiques, forêts aléatoires, k-moyennes.
  • Recommandations, recommendForAllUsers(), recommendForAllItems();

Modèles

  • Chargement et enregistrement de modèles.
  • Mesure de l'efficacité des algorithmes. Courbes ROC. MulticlassClassificationEvaluator().
  • Mesures de performance. Descente de gradient.
  • Modification des hyper-paramètres.
  • Application pratique avec les courbes d'évaluations.

Spark/GraphX

  • Gestion de graphes orientés sur Spark
  • Fourniture d'algorithmes, d'opérateurs simples pour des calculs statistiques sur les graphes
  • Atelier : exemples d'opérations sur les graphes.

IA

  • Introduction aux réseaux de neurones.
  • Les types de couches : convolution, pooling et pertes.
  • L'approche du Deep Learning avec Spark. Deeplearning4j sur Spark.

Chefs de projet, architectes
 

  • Alternance de théorie et pratique avec une vérification des acquis au fur et à mesure de la formation

  • Après avoir suivi l’ensemble des modules et validé l’obtention du parcours, un Certificat Pythagore FD vous sera remis. 

Informations complémentaires

Texte

Prochaines sessions  : 

  • Du 09 au 10 octobre 2023
  • Du 18 au 19 décembre 2023
  • Du 10 au 11 avril 2024
  • Du 24 au 25 juin 2024
  • Du 23 au 24 septembre 2024
  • Du 18 au 19 novembre 2024

 

  • Horaires : 9h00 à 17h30
  • Nombre de participants : 4 à 16 par session
  • Possibilité de faire cette formation en 100% distanciel
  • Nouveau programme
  • Si vous êtes en situation de handicap, retrouvez toutes les informations utiles ICI.

 

Contactez-nous