Formation Continue développement

Python avancé pour data-scientists (LY010)

- Savoir utiliser les principaux outils de traitement et d'analyse de données pour Python
- Savoir appliquer les pratiques optimales en matière de nettoyage et de préparation des données avant l'analyse
- Être capable d'extraire des données d'un fichier
- Comprendre les mécanismes d'interconnexion aux bases de données
- Comprendre les principaux outils de traitement et d'analyse de données pour Python.

Diplôme
Certificat ESIEE-IT
Durée
4 jours
Coût
3 744 €
Campus
Paris 9ème ou à distance

Python avancé pour data-scientists

  • Savoir utiliser les principaux outils de traitement et d'analyse de données pour Python
  • Savoir appliquer les pratiques optimales en matière de nettoyage et de préparation des données avant l'analyse
  • Être capable d'extraire des données d'un fichier
  • Comprendre les mécanismes d'interconnexion aux bases de données
  • Comprendre les principaux outils de traitement et d'analyse de données pour Python.
     

Positionnement Python dans l'analyse de données

  • Besoins des data-scientists : calculs, analyse d'images, machine learning, interface avec les bases de données
  • Apports de python : grande variété d'outils, expertise dans le domaine du calcul scientifique
  • Tour d'horizon des outils:
  • pandas, pyarrow, agate, bokeh, scikit-learn, pybrain, tensorflow, keras, mxnet, caffe.

Calculs et graphiques

  • NumPy : Base du calcul sur des tableaux
  • SciPy : Scientific Tools for Python, couche scientifique
  • Manipulation de tableaux, fonctions mathématiques.
  • Représentation graphique avec basemap et matplotlib.
  • Atelier : Mise en oeuvre de SciPy/NumPy : manipulation d'images, détection de contours

Être capable d'extraire des données d'un fichier

  • Pandas : manipulation de tables de données. Notion de dataframe.
  • Manipulation de données relationnelles
  • Tableaux avec Pandas: indexation, opérations, algèbre relationnelle
  • Stockage dans des fichiers: CSV, JSon
  • Comparaison et performances Pandas / pyarrow / NumPy
  • Atelier : construction d'ETL de base entre json et csv

Comprendre les mécanismes d'interconnexion aux bases de données

  • Définitions : pilotes, connexions, curseurs, CRUD, transactions
  • Les pilotes : postgresql, mysql, mariadb, ... Présentation de sql-alchemy
  • Opérations : gestion du curseur, chargement de données, insertion et modification d'enregistrements
  • Atelier : mise en oeuvre avec postgresql. Construction d'ETL SQL/json.

Comprendre les principaux outils de traitement et d'analyse de données pour Python

  • Présentation des outils d'apprentissage Python : scikit-learn, pybrain, TensorFlow/keras, mxnet, caffe
  • Atelier : mise en oeuvre de scikit-learn et génération de jeux de données.

Créer des sélections et des classements dans de grands volumes de données pour dégager des tendances

  • Présentation de pyspark
  • Machine learning et deep learning
  • TensorFlow : principe de fonctionnement, plateformes supportées, distribution
     

 

À qui s’adresse cette formation ?

Développeurs en Python, Développeurs de logiciels, programmeurs, Data analysts, Data scientists

Pré-requis


Bonne connaissance de la programmation Python. 

  • Alternance de théorie et pratique avec une vérification des acquis au fur et à mesure de la formation

  • Après avoir suivi l’ensemble des modules et validé l’obtention du parcours, un Certificat Pythagore FD vous sera remis. 

Pour vous inscrire, envoyez un mail à  formationcontinue@esiee-it.fr  (réponses sous 48heures). 

Informations complémentaires

Texte

Prochaines sessions  : 

  • Du 27 au 29 novembre 2023
  • Du 12 au 15 février 2024
  • Du 22 au 25 avril 2024
  • Du 10 au 13 juin 2024
  • Du 7 au 10 octobre 2024
  • Du 9 au 12 décembre 2024

 

  • Horaires : 9h00 à 17h30
  • Nombre de participants : 4 à 16 par session
  • Possibilité de faire cette formation en 100% distanciel
  • Nouveau programme
  • Si vous êtes en situation de handicap, retrouvez toutes les informations utiles ICI.

 

Contactez-nous