- Savoir utiliser les principaux outils de traitement et d'analyse de données pour Python
- Savoir appliquer les pratiques optimales en matière de nettoyage et de préparation des données avant l'analyse
- Être capable d'extraire des données d'un fichier
- Comprendre les mécanismes d'interconnexion aux bases de données
- Comprendre les principaux outils de traitement et d'analyse de données pour Python.
Python avancé pour data-scientists (LY010)
Diplôme
Certificat ESIEE-IT
Durée
4 jours
Coût
3 744 €
Campus
Paris 9ème ou à distance
Python avancé pour data-scientists
- Savoir utiliser les principaux outils de traitement et d'analyse de données pour Python
- Savoir appliquer les pratiques optimales en matière de nettoyage et de préparation des données avant l'analyse
- Être capable d'extraire des données d'un fichier
- Comprendre les mécanismes d'interconnexion aux bases de données
- Comprendre les principaux outils de traitement et d'analyse de données pour Python.
Positionnement Python dans l'analyse de données
- Besoins des data-scientists : calculs, analyse d'images, machine learning, interface avec les bases de données
- Apports de python : grande variété d'outils, expertise dans le domaine du calcul scientifique
- Tour d'horizon des outils:
- pandas, pyarrow, agate, bokeh, scikit-learn, pybrain, tensorflow, keras, mxnet, caffe.
Calculs et graphiques
- NumPy : Base du calcul sur des tableaux
- SciPy : Scientific Tools for Python, couche scientifique
- Manipulation de tableaux, fonctions mathématiques.
- Représentation graphique avec basemap et matplotlib.
- Atelier : Mise en oeuvre de SciPy/NumPy : manipulation d'images, détection de contours
Être capable d'extraire des données d'un fichier
- Pandas : manipulation de tables de données. Notion de dataframe.
- Manipulation de données relationnelles
- Tableaux avec Pandas: indexation, opérations, algèbre relationnelle
- Stockage dans des fichiers: CSV, JSon
- Comparaison et performances Pandas / pyarrow / NumPy
- Atelier : construction d'ETL de base entre json et csv
Comprendre les mécanismes d'interconnexion aux bases de données
- Définitions : pilotes, connexions, curseurs, CRUD, transactions
- Les pilotes : postgresql, mysql, mariadb, ... Présentation de sql-alchemy
- Opérations : gestion du curseur, chargement de données, insertion et modification d'enregistrements
- Atelier : mise en oeuvre avec postgresql. Construction d'ETL SQL/json.
Comprendre les principaux outils de traitement et d'analyse de données pour Python
- Présentation des outils d'apprentissage Python : scikit-learn, pybrain, TensorFlow/keras, mxnet, caffe
- Atelier : mise en oeuvre de scikit-learn et génération de jeux de données.
Créer des sélections et des classements dans de grands volumes de données pour dégager des tendances
- Présentation de pyspark
- Machine learning et deep learning
- TensorFlow : principe de fonctionnement, plateformes supportées, distribution
À qui s’adresse cette formation ?
Développeurs en Python, Développeurs de logiciels, programmeurs, Data analysts, Data scientists
Pré-requis
Bonne connaissance de la programmation Python.
- Alternance de théorie et pratique avec une vérification des acquis au fur et à mesure de la formation
- Après avoir suivi l’ensemble des modules et validé l’obtention du parcours, un Certificat Pythagore FD vous sera remis.
Pour vous inscrire, envoyez un mail à formationcontinue@esiee-it.fr (réponses sous 48heures).
Informations complémentaires
Texte
Prochaines sessions :
- Du 27 au 29 novembre 2023
- Du 12 au 15 février 2024
- Du 22 au 25 avril 2024
- Du 10 au 13 juin 2024
- Du 7 au 10 octobre 2024
- Du 9 au 12 décembre 2024
- Horaires : 9h00 à 17h30
- Nombre de participants : 4 à 16 par session
- Possibilité de faire cette formation en 100% distanciel
- Nouveau programme
- Si vous êtes en situation de handicap, retrouvez toutes les informations utiles ICI.