8 mars 2023

Sécurisation et automatisation des plateformes de machine learning

Proposé par Valentin Pauchet, Leader Technique de l'équipe Big Data et Machine Learning, chez Claranet

Le Machine Learning : ouvrir le champ des possibles 

En offrant la possibilité d’améliorer les processus existants pour gagner en efficacité et performance, les algorithmes de Machine Learning constituent aujourd’hui un véritable enjeu pour les entreprises, permettant de construire des modèles d’apprentissage à partir des données qu’elles possèdent. Loin d’être une fin en soi, le but est de créer des modèles capables d’automatiser des tâches (chatbot, reconnaissance de texte, d’image…) et de pouvoir se concentrer sur celles à haute valeur ajoutée. Grâce à l’automatisation, les chabots assurent par exemple des tâches très basiques, délestant les collaborateurs d’une charge qui n’apporte pas tellement de valeur au contact client, et qui peut être gérée par un robot. A cela s’ajoute le Deep Learning, soit l’exploitation de la donnée qui permet de tirer des conclusions, par le croisement de différents styles de données et une puissance de calculs conséquente. Ce genre d’application permet de démultiplier les possibilités de traitement des données auxquelles nous accédons aujourd’hui en masse, pour appliquer de nouveaux usages, comme la maintenance prédictive, et ainsi gagner en efficacité.

Les data scientists travaillent de manière itérative sur l’exploration de la donnée pour développer de nouveaux modèles, rendus ensuite plus précis et déployés pour ingérer de nouvelles données en masse. L’entraînement de modèles est rendu possible par les solutions de Machine Learning répandues sur le marché et la capacité à consommer du hardware à la demande par l’intermédiaire du cloud. Une supervision et optimisation de ces modèles doit être réalisées pour enfin mettre à disposition les résultats au travers d’une API. Ainsi fonctionnent les moteurs de recommandations : le modèle est entraîné avec de nombreux historiques d’activités clients sur site ou en magasin, à partir de quoi il détermine les produits à proposer aux clients. Alimentés d’historiques clients, il associe en temps réel une liste de produits qui pourraient intéresser le client. Nous accompagnons fréquemment nos clients dans la mise en place de Data Challenges afin de créer des interactions entre les services des entreprises et leurs partenaires externes dans le but de stimuler leur créativité. Ainsi, ils obtiennent une solution à leur problème en renforçant la motivation de leurs équipes. 

Le cloud pour couvrir un périmètre fonctionnel beaucoup plus important 

Le Machine Learning, le Deep Learning et globalement tous les traitements d’analytique avancée autour du Big Data nécessitent une équipe de data scientists experts des sujets. Si les entreprises investissent dans ces experts, en propre ou en externalisé, sans trop de difficulté, l’infrastructure peut en revanche être coûteuse, car elle repose sur des cartes graphiques pour supporter le calcul intensif des modèles de Machine Learning. Amortir les investissements et les coûts fixes que représente une telle infrastructure s’avère très difficile. 

Les solutions de Machine Learning de cloud providers, comme Azure Machine Learning ou Sagemaker d’AWS sont alors des solutions de plus en plus privilégiées. Elles permettent de répondre à un périmètre fonctionnel beaucoup plus important sans avoir à réaliser des investissements importants dans une infrastructure. Toutefois, ces solutions ne sont pas du « click and run », mais demandent au contraire un certain temps d’architecture, d’installation, d’industrialisation, de sécurisation, et d’intégration avec l’écosystème de nos clients (réseau, sécurité, gouvernance de la donnée …). « Cloud Agnostic », Claranet accompagne les entreprises dans ces différentes démarches de choix de solutions, d’intégration et de support utilisateurs. Claranet adopte une approche de déploiement « Infrastructure as Code » en créant et gérant l’écosystème cloud (Azure, AWS), réseau, les couches plateforme classiquement et les composants Machine Learning opérées par des CloudOps. Les expertises devops de Claranet permettent l’accompagnement sur la mise en place de chaînes de déploiement continue pour les Data Scientists travaillant sur les plateformes, les accompagnant sur la mise en production des algorithmes et modèles de données. Par l’intermédiaire de la conteneurisation, aujourd’hui au centre des plateformes de Machine Learning, l’exploration au travers d’environnement de travail de Data Science (notebook) est rendue possible, accentuant les capacités d’autoscaling, provisionning avancé et isolement des environnements de travail. Afin de répondre aux besoins de nos clients souhaitant utiliser un cloud souverain, Claranet a également la capacité d’accompagner ses clients sur le déploiement d’une plateforme Machine Learning On Premise ou sur des cloud privés souverain, avec un déport de charge dans le cloud public. 

Opter pour un accompagnement sécurisé et innovant 

L’expertise et la gestion de l’infrastructure cloud, du réseau, de la sécurité, des solutions d’analytiques avancés, de la conteneurisation et des images Docker, l’accompagnement des Data scientists, demandent de nombreux interlocuteurs avec des expertises variées, d’où l’intérêt de recourir à un prestataire de confiance. 

Faire appel à Claranet, c’est se focaliser sur l’apport métier de son activité autour de la Data science et du Machine Learning

La plus-value de Claranet réside dans son rapport agnostique aux solutions (Databricks, Dataiku, Jupyter, Spark, Cloudera…) et au cloud (AWS, Azure), lui permettant d’offrir à ses clients un accompagnement industrialisé et sécurisé sur les plateformes de Machine Learning. Préconisations, optimisation des ressources et de la performance : l’accompagnement de Claranet ne se limite pas à la mise en place technique de la solution, mais s’inscrit dans le long terme. Les offres des fournisseurs de cloud évoluant en permanence, Claranet, via ses partenariats stratégiques et ses niveaux de certification, se tient en veille permanente pour garantir à ses clients le meilleur niveau de service possible, notamment au niveau de la cellule Big Data de la practice Data de Claranet, pour se tenir à la pointe des évolutions des solutions de data science. Les clients de Claranet bénéficient alors de conseils en amélioration et optimisation pour être toujours au maximum de leurs capacités.