RNCP35288 - Concepteur développeur en science des données
Retour à la liste des titres RNCPType | Niveau | Certificateur | Date de fin de validité |
---|---|---|---|
Niveau 6 | JEDHA | 10/02/2026 |
Les concepteurs développeurs en science des données sont en mesure de concevoir une architecture de données robuste en créant des lacs de données (Data Lake) et des entrepôts de données (Data Warehouse) pour stocker et protéger les données de l'entreprise selon les normes définies par un cahier des charges.
A2. Collecte de donnéesLes professionnels formés peuvent collecter des données provenant de différentes sources (Web, logiciels internes ou externes) en utilisant des librairies de programmation comme Scrapy ou Beautifulsoup, tout en respectant les normes de protection des données utilisateurs définies dans le RGPD.
A3. Gestion d'entrepôts de données (Data Warehouse)Les compétences acquises permettent également de nettoyer et organiser les données dans l'entrepôt de données en écrivant des processus d'extraction, transformation et chargement (ETL) pour les rendre disponibles et compréhensibles pour les autres équipes métiers.
A4. Analyse exploratoire de donnéesLes professionnels formés sont capables de traiter et d'analyser des données grâce à des techniques statistiques descriptives et inférentielles, en utilisant des librairies de programmation telles que Numpy ou Pandas.
A5. Visualisation et présentation de donnéesLes compétences acquises permettent de présenter les résultats d'une analyse statistique en utilisant des librairies de programmation comme Plotly ou Matplotlib, afin de faciliter la prise de décisions et d'appuyer leur déclinaison opérationnelle.
A6. Mise en place d'un algorithme d'apprentissage automatiqueLes professionnels formés peuvent mettre en place des algorithmes d'apprentissage automatique (Machine Learning) pour automatiser des tâches liées aux résultats des prédictions de ces algorithmes.
A7. Segmentation et réduction de base de donnéesIls sont également capables de segmenter une base de données en différents groupes homogènes ou de réduire sa dimension pour en faciliter l'analyse et la visualisation.
A8. Optimisation des performances des algorithmes d'apprentissage automatiqueLes compétences acquises permettent d'optimiser les performances des algorithmes d'apprentissage automatique en déterminant l'influence des différentes variables et en les améliorant afin de démontrer leur utilité aux directions métiers.
A9. Mise en place d'un apprentissage automatique profondLes professionnels formés peuvent mettre en place des algorithmes d'apprentissage automatique profond (Deep Learning) pour analyser des données non-structurées telles que des images, du texte ou de l'audio.
A10. Optimisation des performances des algorithmes d'apprentissage automatique profond pour industrialisationIls sont capables d'optimiser les performances de ces algorithmes en modifiant les hyperparamètres afin de les rendre adaptés à une utilisation industrielle.
A11. Industrialisation d'algorithmes d'apprentissage automatiqueLes compétences acquises permettent d'industrialiser ces algorithmes en les intégrant dans des applications utilisables par toutes les équipes métiers de l'entreprise pour prendre des décisions basées sur ces résultats.
A12. Production d'applications d'intelligence artificielle utilisables par toutes les équipes métierLes professionnels formés peuvent produire des applications d'intelligence artificielle utilisables par toutes les équipes métiers de l'entreprise pour faciliter la prise de décisions basées sur des données.
A13. Définition d'une modélisation statistique pour répondre aux problématiques des directions métiersLes compétences acquises permettent de définir une modélisation statistique adaptée pour répondre aux problématiques des directions métiers de l'entreprise.
A14. Construction d'un système de gestion et de suivi de projet d'analyse et de gestion de donnéesLes professionnels formés sont en mesure de construire un système de gestion et de suivi de projet pour les analyses et la gestion de données dans l'entreprise.
A15. Direction de projets de gestion de donnéesLes compétences acquises permettent de diriger des projets de gestion de données au sein de l'entreprise.
Les capacités attestées par la certification sont regroupées en 4 blocs principaux. Bloc n°1 - Construction et alimentation d'une infrastructure de gestion de donnéesCe bloc de compétences permet de concevoir une architecture de données adaptée en créant des lacs de données et des entrepôts de données, en intégrant la dimension de stockage et de calcul distribuée et en collectant des données provenant de différentes sources pour alimenter le Data Lake.
Bloc n°2 - Analyse exploratoire, descriptive et inférentielle de donnéesCe bloc de compétences permet de traiter et d'analyser des bases de données grâce à des techniques statistiques descriptives et inférentielles, en optimisant les analyses grâce au traitement parallélisé, en présentant les résultats et en les synthétisant devant un public non-spécialiste.
Bloc n°3 - Analyse prédictive de données structurées par l'intelligence artificielleCe bloc de compétences permet de traiter des données structurées en créant un pipeline de traitement, d'effectuer des analyses prédictives et d'évaluer la performance prédictive des algorithmes d'apprentissage automatique.
Bloc n°4 - Analyse prédictive de données non-structurées par l'intelligence artificielleCe bloc de compétences permet de traiter des données non-structurées en créant des fonctions de traitement, d'élaborer des réseaux de neurones adaptés et d'optimiser leurs performances pour une utilisation industrielle.
En résumé, la certification Concepteur développeur en science des données vise à former des professionnels capables de gérer et d'analyser des données pour répondre aux besoins des entreprises. Les compétences acquises permettent d'accéder à des métiers tels que Data Scientist, Data Analyst, Business Analyst ou encore Chief Data Officer. Les capacités attestées portent sur la construction et l'alimentation d'une infrastructure de gestion de données, l'analyse exploratoire, descriptive et inférentielle de données, ainsi que sur l'analyse prédictive de données structurées et non-structurées grâce à l'intelligence artificielle.- Cette fiche est liée au(x) code(s) NSF suivant(s) :
- 326 - Informatique, traitement de l'information, réseaux de transmission
- 114g - Mathématiques de l'informatique, mathématiques financières, statistique de la santé