La formation Business Analyst : le pont entre le fonctionnel et l’informatique vous permettra de savoir :
- Définir et formaliser les besoins métier.
- Rechercher des solutions aux problèmes Business.
- Communiquer auprès des acteurs du projet.
- Assurer la conformité de la solution aux besoins.
Business Analyst : le pont entre le fonctionnel et l’informatique - BAFO0
Diplôme
Certificat ESIEE-IT
Durée
3 jours (soit 21 heures)
Coût
2 190 € HT
Campus
Campus Pontoise ou À distance
Dask, mise en œuvre et programmation
- Savoir mettre en œuvre Dask pour paralléliser des calculs en Python.
Introduction
- Présentation de Dask, fonctionnalités, apports.
- Comparaison avec d'autres environnements : yarn, spark.
- Calculs parallèles en environnements distribués, ou sur un seul serveur.
- Les composants de Dask : scheduler, collections BigData.
Premiers pas avec Dask
- Différentes méthodes d'installation : Anaconda, pip, depuis les sources
- Atelier : installation, et création d'objets Dask,
- Choix des méthodes et tâches, visualisation des graphes d'exécution.
- exécution par le scheduler.
Eléments de base
- Array : cas d'usages, compatibilité NumPy, définition de chunks, exemples, bonnes pratiques
- Atelier : création, stockage de Dask Array
- Bag : définition, limites
- Atelier : exemple de création, stockage, calcul sur des Dask Bags
- Dask Dataframes : regroupement de dataframes pandas, stockage sur disque ou dans un cluster,
- critères de choix par rapport aux dataframes pandas, bonne pratiques,
- compatibilité avec Parquet, intégration de tables SQL
- Atelier : mise en œuvre de dask.dataframes et comparaison avec pandas
- Delayed ou Futures : une exécution stockée dans un graphe d'actions, ou en temps réel, critères de choix.
Fonctionnement avancé
- Gestion des performances
- Configuration du scheduler
- Les graphes d'exécution
- Utilisation du dashboard
- Outils de debugging
- Atelier : tests de performances et debugging.
Dask.distributed
- Fonctionnalités : exécution dans un environnement distribué ou en local, outils de diagnostic et de suivi des performances, utilisation de l'API Futures pour des calculs en temps réel
- Architecture : dask-scheduler et dask-worker
- Atelier : mise en oeuvre de dask.distributed : installation, configuration, initialisation d'un client.
- Présentation du dashboard
- Analyse des performances
- Limites de Dask.distributed
- Bonnes pratiques.
Dask-ML
- Apports : utiliser les outils classiques de machine learning comme scikit-learn dans un environnement Dask
- Exemples d'utilisation : modèles complexes, volumes de données importants
- Présentation de Dask-ML et principe de fonctionnement
- Intégration scikit-learn, PyTorch, Keras / Tensorflow
- Atelier : Installation et exemples avec scikit-learn.
À qui s’adresse cette formation ?
- Chefs de projet, Data Scientists, Développeurs, Architectes...
Quels sont les prérequis ?
- Bases de la programmation python
Méthodes pédagogiques
- Apports théoriques suivis d’applications
- Travaux pratiques réalisés
Méthodes d'évaluations
- QCM d'évaluation des acquis
- À l’issue de cette formation, un certificat ESIEE-IT vous sera délivré.
Pour vous inscrire, envoyez un mail à formationcontinue@esiee-it.fr (réponses sous 48heures).
Informations complémentaires
Texte
Prochaines sessions :
- Du 13 au 15 novembre 2023
- Horaires : 9h00 à 17h30
- Taux de réussite : nouvelle formation
- 100% à distance (D) ou en présentiel (P)
- Si vous êtes en situation de handicap, retrouvez toutes les informations utiles ICI