La formation Dataiku DSS vous permettra de savoir installer, configurer, Dataiku DSS, l'utiliser depuis l'interface web ou des API.
Dataiku DSS (DS034)
Durée
2 jours (soit 14 heures)
Coût
1 932 €
Campus
Paris 9ème ou à distance
Dataiku DSS
Savoir installer, configurer, Dataiku DSS, l'utiliser depuis l'interface web ou des API.
Présentation, concepts DSS
Fonctionnalités :
- Mise à disposition des méthodes et outils de data-sciences à partir d'une interface graphique ou de langages de requêtage ou de programmation (Python, SQL, R)
- Notions de projet, data, dataset, recipes
- Premiers pas avec Dataiku DSS : exemples.
Connexion aux données
- Connecteurs disponibles, formats de fichiers, formats spécifiques hadoop/Spark
- Chargement des fichiers, emplacement des fichiers,
- Système de fichiers, HDFS, Amazon S3, stockage Google Cloud, etc...
- FTP, connexion ssh, connexion aux bases de données SQL
- Autres stockages : Cassandra, MongoDB, Elasticsearch, ...
Préparation des données
- Scripts de préparation, échantillonnage, exécution,
- les différents moteurs d'exécution: DSS, Spark, base de données SQL, Spark.
Graphiques et statistiques
- Présentation des types de graphiques disponibles et configuration
- Echantillonnage et exécution, graphiques de base, tables, nuages de points, visualisation cartographique, etc...
- Réalisation d'exercices pratiques.
- Fonctionnalités statistiques disponibles, démonstrations.
Machine Learning
- Fonctionnalités disponibles : apprentissage supervisé et non supervisé, algorithmes utilisés, scoring, deep learning, optimisation de modèles, ....
Flow/Recipes
- Interface graphique de gestion des cycles de traitement, des datasets, des traitements, paramétrage de l'exécution en parallèle, des données géographiques, export en format pdf ou images, etc...
- Travaux pratiques.
Interfaces de programmation
- Présentation des différentes interfaces : SQL, Python, R
- Exemples d'interrogations SQL et Python
- Interfaçage avec Spark.
À qui s’adresse cette formation ?
Chefs de projet, développeurs, data-scientists, utilisateurs de Dataiku DSS.
Quels sont les prérequis ?
Connaissance des principes de la manipulation de données et du machine learning.
Méthodes pédagogiques
- Apports théoriques suivis d’applications
- Travaux pratiques réalisés
Méthodes d'évaluations
- QCM d'évaluation des acquis
- À l’issue de cette formation, un certificat ESIEE-IT vous sera délivré.
Pour vous inscrire, envoyez un mail à formationcontinue@esiee-it.fr (réponses sous 48heures).
Informations complémentaires
Texte
Prochaines sessions :
- Du 11 au 12 octobre 2023
- Du 20 au 21 décembre 2023
- Du 25 au 26 mars 2024
- Du 27 au 28 mai 2024
- Du 4 au 5 septembre 2024
- Du 12 au 13 novembre 2024
- Horaires : 9h00 à 17h30
- Taux de réussite : nouvelle formation
- 100% à distance (D) ou en présentiel (P)
- Si vous êtes en situation de handicap, retrouvez toutes les informations utiles ICI