1 août 2020

Apprentissage automatique et gestion des données avec Cloudera

Cloudera, avec sa plateforme de données intégrée, offre une gamme complète de services pour répondre à ces besoins. Dans cet article, nous allons explorer Cloudera Machine Learning et Cloudera Data Platform, deux composants clés de l'écosystème Cloudera, ainsi que leurs principaux cas d'usages.

Cloudera Machine Learning

Cloudera Machine Learning est un service d'apprentissage automatique d'entreprise conçu pour la plateforme de données Cloudera. Ce service permet aux entreprises de déployer rapidement de nouveaux espaces de travail d'apprentissage automatique (ML) ou des environnements d'apprentissage en machine virtuelle pour les équipes, offrant ainsi un accès en libre-service aux données et aux outils nécessaires pour les flux de travail d'apprentissage en machine de bout en bout.

Cloudera Machine Learning se distingue par plusieurs caractéristiques clés qui en font un outil précieux pour les data scientists et les équipes d'apprentissage automatique. Tout d'abord, il permet de déployer en quelques clics de nouveaux espaces de travail d'apprentissage machine pour les équipes, avec accès aux environnements de projet et aux ressources dont elles ont besoin. Cette capacité à créer des espaces de travail instantanés est particulièrement utile pour les entreprises qui cherchent à accélérer le développement et le déploiement de modèles d'apprentissage automatique.

Ensuite, Cloudera Machine Learning offre une réplication rapide des ensembles de données dans des environnements hybrides et multi-cloud, tout en maintenant la sécurité des données de l'entreprise et les contrôles de gouvernance. Cette fonctionnalité est essentielle pour les entreprises qui opèrent dans des environnements complexes et nécessitent une gestion rigoureuse des données.

De plus, Cloudera Machine Learning permet aux data scientists d'accéder à leurs outils scientifiques préférés tout en préservant la sécurité. Cette flexibilité est cruciale pour les équipes de data science qui ont besoin d'utiliser des outils spécifiques pour leurs projets.

Le service fournit également des ressources IT hétérogènes et à l'échelle dont les équipes ont besoin pour travailler rapidement, tout en maintenant des garde-fous ajustables. Cette capacité à offrir des ressources élastiques est essentielle pour les entreprises qui cherchent à optimiser l'utilisation de leurs ressources IT.

Enfin, Cloudera Machine Learning offre une expérience utilisateur complète et cohérente, couvrant l'ingénierie des données, la formation aux modèles, le suivi des expériences, le déploiement et la gestion des modèles de production, le tout dans un environnement transparent. Cette intégration complète permet aux équipes de travailler de manière plus efficace et de tirer parti de leurs données de manière optimale.

Intégration avec Cloudera Data Platform

Cloudera Machine Learning est entièrement intégré à la Cloudera Data Platform (CDP), y compris l'entrepôt de données et le centre de données Cloudera. Cette intégration permet de fournir rapidement de nouvelles analyses multifonctionnelles et un apprentissage automatique dans n'importe quel cloud, permettant aux entreprises de créer, gérer et mettre à l'échelle des applications intelligentes alimentées par des données n'importe où - de l'Edge à l'IA.

Cloudera Data Platform (CDP)

Cloudera Data Platform (CDP) est une plateforme de données intégrée facile à déployer, à gérer et à utiliser. Elle fournit des analyses puissantes en libre-service dans des environnements hybrides et multi-clouds, avec les politiques de sécurité et de gouvernance granulaires que les responsables IT exigent.

CDP offre un choix et une flexibilité maximum avec la possibilité de gérer, d'analyser et d'expérimenter les données sur place, dans des environnements hybrides, des nuages privés et de multiples nuages publics. Cette flexibilité est essentielle pour les entreprises qui cherchent à tirer parti de leurs données dans des environnements variés.

De plus, CDP réduit le temps et les efforts nécessaires au déploiement de types d'applications communes grâce à cinq nouvelles expériences en libre-service : flux et streaming, ingénierie des données, entrepôt de données, base de données opérationnelle et apprentissage machine. Cette diversité d'expériences permet aux entreprises de répondre à une large gamme de besoins en matière de gestion des données.

CDP simplifie également la sécurité, la confidentialité et la conformité des diverses données d'entreprise sur n'importe quel nuage grâce aux technologies SDX (shared data experience). Cette approche centralisée de la gouvernance des données est cruciale pour les entreprises qui doivent se conformer à des réglementations strictes.

Enfin, Cloudera Data Platform est une technologie 100 % open source, IT, stockage et intégration ouverts, permettant une innovation rapide et protégeant les organisations contre le verrouillage des fournisseurs. Cette ouverture est essentielle pour les entreprises qui cherchent à éviter les contraintes de fournisseurs spécifiques et à maintenir une flexibilité maximale.

Services Disponibles sur Cloudera Data Platform

CDP offre plusieurs services clés qui en font une plateforme de données complète et polyvalente. Tout d'abord, Cloudera Data Warehouse est un service natif du cloud qui permet aux équipes d'analystes de déployer rapidement et facilement des entrepôts de données avec un accès libre-service sécurisé aux données de l'entreprise. Ce service est particulièrement utile pour les entreprises qui cherchent à optimiser leurs analyses de données et à tirer parti de leurs données de manière plus efficace.

Ensuite, Cloudera Machine Learning est un service natif du cloud qui permet de déployer rapidement et facilement des espaces de travail collaboratifs d'apprentissage automatique pour des équipes de scientifiques ayant un accès sécurisé et en libre-service aux données d'entreprise. Ce service est essentiel pour les entreprises qui cherchent à développer et à déployer des modèles d'apprentissage automatique de manière plus rapide et plus efficace.

Enfin, Cloudera Data Hub est un service de gestion et d'analyse des données dans le nuage qui permet aux informaticiens et aux développeurs de créer rapidement et facilement des applications commerciales personnalisées prenant en charge divers cas d'utilisation. Ce service est particulièrement utile pour les entreprises qui cherchent à tirer parti de leurs données de manière plus innovante et à développer des applications personnalisées pour répondre à leurs besoins spécifiques.

Cloudera Data Warehouse

Cloudera Data Warehouse est un service natif du cloud qui permet aux équipes d'analystes de déployer rapidement et facilement des analyses en libre-service sur Cloudera Data Platform (CDP). Il permet un déploiement rapide et une administration facile de l'entrepôt de données dans le cloud, en déplaçant de manière transparente les charges de travail sur site vers le cloud avec une sécurité et une gouvernance cohérentes.

Cloudera Data Warehouse se distingue par plusieurs caractéristiques clés qui en font un outil précieux pour les équipes d'analystes. Tout d'abord, il offre une mise à l'échelle automatique qui permet un accès immédiat et facile à des volumes de données de haute qualité, tous sécurisés et régis par les technologies SDX de Cloudera. Cette capacité à mettre à l'échelle rapidement est essentielle pour les entreprises qui cherchent à tirer parti de leurs données de manière plus efficace.

Ensuite, Cloudera Data Warehouse offre un accès aux données en libre-service pour des analyses rapides et réactives à l'échelle, dans le cadre de déploiements hybrides et multi-cloud. Cette fonctionnalité est cruciale pour les entreprises qui cherchent à optimiser leurs analyses de données et à tirer parti de leurs données de manière plus efficace.

De plus, Cloudera Data Warehouse offre l'auto-provisionnement pour embarquer rapidement et sans attendre les projets spéciaux et les charges de travail prioritaires. Cette capacité à provisionner rapidement des ressources est essentielle pour les entreprises qui cherchent à répondre rapidement aux besoins de leurs projets.

Enfin, Cloudera Data Warehouse offre une optimisation du cloud pour augmenter et suspendre les ressources à la demande, en minimisant les coûts et en maximisant la disponibilité des ressources. Cette capacité à optimiser l'utilisation des ressources cloud est essentielle pour les entreprises qui cherchent à optimiser leurs coûts et à maximiser leur efficacité.