La formation Spark ML vous permettra de savoir mettre en œuvre les outils de Machine Learning sur Spark et de savoir créer des modèles et les exploiter.

Diplôme
Certificat ESIEE-IT
Durée
2 jours (soit 14 heures)
Coût
1 932 €
Campus
Paris 9ème ou à distance

Spark ML

Savoir mettre en oeuvre les outils de Machine Learning sur Spark, savoir créer des modèles et les exploiter.

Introduction

  • Rappels sur Spark : principe de fonctionnement, langages supportés.

DataFrames

  • Objectifs : traitement de données structurées. L'API Dataset et DataFrames
  • Optimisation des requêtes. Mise en oeuvre des Dataframes et DataSet.
  • Chargement de données, pré-traitement : standardisation, transformations non linéaires, discrétisation
  • Génération de données.

Traitements statistiques de base

  • Introduction aux calculs statistiques. Paramétrisation des fonctions.
  • Applications aux fermes de calculs distribués. Problématiques induites. Approximations. Précision des estimations.
  • Exemples sur Spark : calculs distribués de base : moyennes, variances, écart-type, asymétrie et aplatissement (skewness/kurtosis).

Machine Learning

  • Apprentissage automatique : définition, les attentes par rapport au Machine Learning
  • Les valeurs d'observation, et les variables cibles. Ingénierie des variables.
  • Les méthodes : apprentissage supervisé et non supervisé. Classification, régression.
  • Fonctionnalités : Machine Learning avec Spark, algorithmes standards, gestion de la persistance, statistique.

Mise en œuvre sur Spark

  • Mise en œuvre avec les DataFrames.
  • Algorithmes : régression linéaire, k-moyennes, k-voisins, classification naïve bayésienne, arbres de décision, forêts aléatoires, etc...
  • Création de jeux d'essai, entraînement et construction de modèles.
  • Prévisions à partir de données réelles.
  • Atelier : régression logistiques, forêts aléatoires, k-moyennes.
  • Recommandations, recommendForAllUsers(), recommendForAllItems();.

Modèles

  • Chargement et enregistrement de modèles.
  • Mesure de l'efficacité des algorithmes. Courbes ROC. MulticlassClassificationEvaluator().
  • Mesures de performance. Descente de gradient.
  • Modification des hyper-paramètres.
  • Application pratique avec les courbes d'évaluations.

Spark/GraphX

  • Gestion de graphes orientés sur Spark
  • Fourniture d'algorithmes, d'opérateurs simples pour des calculs statistiques sur les graphes
  • Atelier : exemples d'opérations sur les graphes.

IA

  • Introduction aux réseaux de neurones.
  • Les types de couches : convolution, pooling et pertes.
  • L'approche du Deep Learning avec Spark. Deeplearning4j sur Spark.

À qui s’adresse cette formation ?

Chefs de projet, architectes.
 

Quels sont les prérequis ? 

Connaissance d'un langage de programmation comme Python, Java ou Scala. 
 

Méthodes pédagogiques 

  • Apports théoriques suivis d’applications 
  • Travaux pratiques réalisés 
     

Méthodes d'évaluations

  • QCM d'évaluation des acquis

  • À l’issue de cette formation, un certificat ESIEE-IT vous sera délivré.

Pour vous inscrire, envoyez un mail à formationcontinue@esiee-it.fr  (réponses sous 48heures). 

Informations complémentaires

Texte

Prochaines sessions : 

  • Du 9 au 10 octobre 2023
  • Du 18 au 19 décembre 2023
  • Du 10 au 11 avril 2024
  • Du 24 au 25 juin 2024
  • Du 23 au 24 septembre 2024
  • Du 18 au 19 novembre 2024
  • Horaires : 9h00 à 17h30
  • Taux de réussite : nouvelle formation 
  • 100% à distance (D) ou en présentiel (P)
  • Si vous êtes en situation de handicap, retrouvez toutes les informations utiles  ICI

 

Contactez-nous