RNCP37750 - Concepteur manager des infrastructures de données massives

Retour à la liste des titres RNCP
Type Niveau Certificateur Date de fin de validité
Niveau 7 EXCELIA GROUP 19/07/2026

La certification Concepteur manager des infrastructures de données massives, de niveau 7 et délivrée par EXCELIA GROUP, vise à former des professionnels capables de gérer et de concevoir des infrastructures de données massives. Ces infrastructures sont de plus en plus présentes dans les entreprises, et il est donc essentiel d'avoir des experts pour les mettre en place et les gérer efficacement.

Les activités visées par cette certification incluent la veille scientifique, technologique et règlementaire, ainsi que l'identification de l'état de l'art des outils et plateformes logiciels ETL. Les professionnels formés seront également capables de spécifier les besoins et de dimensionner les infrastructures de données massives sur le long terme. Ils seront en mesure d'évaluer et de sélectionner une solution ETL complète, incluant des développements en propre, des plateformes logicielles et des API disponibles sur le marché.

En plus de ces compétences techniques, les diplômés seront également formés pour développer une infrastructure fonctionnelle et pour gérer les flux et les stocks de données en respectant les normes du RGAA et du RGPD. Ils pourront ainsi identifier et sélectionner les meilleures solutions data lake disponibles sur le marché, et les déployer en interne ou dans le cloud.

Les professionnels formés seront également chargés de superviser la rédaction des documents supports à l'utilisation des outils et plateformes logicielles, ainsi que de la mise en place des bases de données internes et externes en conformité avec le RGPD et les critères du RGAA. Ils seront également en charge de l'évaluation et de la sélection d'une solution de traitement et d'entreposage des données, ainsi que du déploiement des processus de traitement et de formatage des données brutes pour entreposage.

Ils devront également s'assurer de la mise à disposition de données fiables et pertinentes pour les utilisateurs, en élaborant un guide d'utilisation des plateformes et des API déployées. Ils seront également chargés de rédiger un cahier des charges technique et fonctionnel répondant aux besoins des scientifiques et des analystes, et de piloter le développement d'API, de requêtes et de routines automatisées avec l'implication de toutes les parties prenantes.

Les professionnels formés devront également anticiper les besoins des utilisateurs et améliorer en continu les plateformes logicielles ETL. Ils seront en charge de mettre en place des indicateurs de performance des projets sur l'ensemble de leur cycle de vie, et de gérer les processus d'automatisation et de fiabilisation des infrastructures, des plateformes et des interfaces.

Enfin, ils contribueront à l'amélioration de la qualité des données mises à disposition des utilisateurs, en concevant et en mettant en oeuvre des tests d'intégration avant le déploiement d'algorithmes d'IA, de nouvelles plateformes logicielles ou d'API. Les capacités attestées par cette certification incluent notamment la mise en oeuvre d'une veille scientifique, technologique et règlementaire concernant les outils et plateformes logiciels ETL de données massives, ainsi que la capacité à anticiper les besoins futurs pour concevoir et dimensionner une architecture compatible avec la montée en charge des cas d'usage, en particulier ceux liés à l'IA.

Les professionnels formés seront également capables de mobiliser des savoirs techniques hautement spécialisés en plateformes et outils logiciels pour évaluer différentes solutions ETL, ainsi que de recueillir les besoins des différents cas d'usage pour développer une architecture de flux de données en établissant un cahier des charges fonctionnel et technique.

Ils devront également être en mesure de concevoir une infrastructure fonctionnelle et matérielle pour organiser les flux et les traitements de données depuis des sources multivariées internes et externes jusqu'à un utilisateur final, en mobilisant les principes de la RSE et le RGPD pour participer à l'établissement des règles de gouvernance et de conservation des données et garantir l'accessibilité des data selon les normes du RGAA.

Les professionnels formés seront également en mesure de recenser et caractériser les outils d'extraction et de stockage de données brutes disponibles sur le marché pour sélectionner la solution la plus adaptée aux besoins de l'entreprise, ainsi que de mobiliser des savoirs techniques approfondis en déploiement de bases de données pour évaluer les mérites et les limites d'un stockage en propre par rapport à une solution déportée sur le cloud.

Enfin, ils devront être capables de mettre en oeuvre un processus complet d'extraction pour recueillir des données issues de sources multiples et les stocker dans une base de données brutes, ainsi que d'identifier et de préparer toutes les données pertinentes afin de faciliter leur traitement et leur stockage ultérieurs dans un entrepôt de données. Ils devront également documenter l'utilisation des bases de données externes et internes pour gérer et entretenir le lac de données en respectant le RGPD et en garantissant l'accessibilité des données selon les normes du RGAA.

En somme, cette certification forme des professionnels hautement qualifiés capables de mobiliser des savoirs techniques avancés en gestion de bases de données pour sélectionner et mettre en oeuvre les solutions de traitement et de stockage massifs adaptées au besoin de l'entreprise, tout en veillant à l'application des critères du RGAA dans la mise en oeuvre des solutions pour garantir l'accessibilité des données aux PSH. Ils seront également en mesure d'anticiper les besoins des utilisateurs et d'améliorer en continu les plateformes logicielles ETL, tout en contribuant à l'amélioration de la qualité des données mises à disposition des utilisateurs.