SAAGIE

Karine GOUTORBE

Marketing Manager

+33 2 72 88 31 69

Analytique

API

Applications

Dataviz

Infrastructure

Institutionnels

Consultants/SSII

Intégrateurs

Le Big Data et l’Intelligence Artificielle (IA) ont suscité un intérêt croissant ces dix dernières années, aussi bien sur les marchés B2C que B2B. Néanmoins, ces technologies n’ont pas encore réussi à amener des preuves de réussites à grande échelle. De plus, évaluer le ROI de ce type d’initiatives reste complexe. Enfin, on estime à moins de 25% le nombre de projets Big Data / IA qui réussissent à quitter le stade de POC (Proof of Concept) et à franchir les portes de la production.

 

 

Les facteurs-clés de succès : l’Homme et la Technologie

La raison pour laquelle les entreprises ont des difficultés à appréhender ce type de projets est double :

  • Un manque d’alignement entre les équipes IT, data et métiers qui n’ont manifestement pas les mêmes objectifs, contraintes et délais ;
  • Un immense écosystème de technologies qui évoluent constamment et qui ne sont pas intégrées les unes aux autres.

 

La clé résiderait donc dans la réconciliation de ces deux composantes au regard de la stratégie numérique des entreprises.

 

 

Comment Saagie facilite la mise en oeuvre de vos projets data ?

Saagie met à disposition des entreprises une Data Fabric, solution prête à l’emploi orchestrant le meilleur des technologies data. Le but ? Automatiser les processus opérationnels de l’entreprise et déployer des applications métiers à grande échelle.

 

 

Concrètement, elle permet notamment de :

  • Profiter d’un environnement de travail unique réunissant les outils les plus populaires pour l’ensemble des parties-prenantes des projets data : IT, Data Lab, Métiers ;
  • Faire abstraction de la complexité liée à l’implémentation et à la maintenance des technologies Big Data / IA au sein du SI des entreprises

 

Grâce à la Data Fabric, les entreprises peuvent développer des projets data de bout en bout et les déployer en production en un clin d’oeil, le tout conformément à leurs critères de gouvernance et de sécurité.

 

 

Les cinq fonctionnalités majeures de la Data Fabric de Saagie

  • Saagie Store : accès à une marketplace publique pour connecter des solutions partenaires à la demande (Trifacta, Talend, R Studio, Jupyter, etc.) ;
  • Projets Analytiques : interface user-friendly pour constituer des équipes, sélectionner les infrastructures et technologies et créer des pipelines de traitement. Possibilité ensuite de partager les projets avec d’autres équipes, dans d’autres environnements sécurisés ;
  • Gouvernance & Sécurité : portail simplifié pour contrôler simplement les accès aux données, gérer l’authentification et le chiffrement, documenter les datasets (métadonnées) ou les exposer par API ;
  • Orchestrateur de traitements : couche DataOps de la Data Fabric. Elle permet aux chargés d’exploitation et équipes data d’ordonnancer, versionner et superviser les travaux, centraliser les logs, gérer les ressources physiques et auditer l’activité ;
  • Infrastructure hybride : possibilité de déployer la Data Fabric aussi bien dans le cloud (Saagie Cloud ou clouds publics tels qu’Azure, AWS, GCP…), sur site avec la Saagie Appliance, ou véritablement on-premise sur votre cluster Kubernetes.

 

 

à qui s’adresse la Data Fabric de Saagie ?

  • IT Ops Manager : un environnement sécurisé pour superviser les travaux et les amener en production de manière sécurisée ;
  • Data Engineer : tirer parti des frameworks de calcul distribué et de streaming temps-réel (Hive, Impala, Spark, Kafka) pour concevoir des pipelines permettant d’alimenter efficacement les modèles des data scientists ;
  • Data Scientist : exploitation des dernières versions des technologies de Machine Learning / Deep Learning (R, Python, Spark) ; accès à une quantité plus large de données et passage des algorithmes à l’échelle ;
  • Business Analyst : accès simplifié à des jeux de données qualifiés ; possibilité de connecter facilement des applications de modélisation ou de visualisation ;
  • Data Steward : des outils pour documenter la donnée et gérer les accès.