Cisco Systems

Olivier NERAUT

0 800 770 400

Analytique

API

Applications

Dataviz

Infrastructure

Institutionnels

Consultants/SSII

Intégrateurs

Quantium s’empare d’une nouvelle niche dans le marché de l’analytique

En alliant une distribution MapR Hadoop à l’infrastructure Cisco UCS, le spécialiste de l’analytique diminue ses temps de requête de 92% et améliore la précision de ses résultats.

 

Les besoins

Les consommateurs australiens sont parmi les plus avancés technologiquement. Valorisant la personnalisation de leur expérience, ils s’attendent à recevoir des messages, des recommandations et des promotions adaptées à chacun. De telles observations apportent une pierre à l’édifice de Quantium, société spécialisée dans la data analytique basée à Sydney. Depuis 15 ans, Quantium offre à ses client un aperçu des besoins consommateurs, de leurs comportements, de leurs habitudes d’achats, des media qu’ils consultent en appliquant des techniques rigoureuses de data science aux données transactionnelles. Forte de son expérience dans les secteurs du retail, de la finance et des médias, l’entreprise travaille avec des sociétés telles que Woolworths, National Australia Bank ou Coca Cola. A l’origine, Quantium analysait uniquement les données fournies par ses clients. Un business très lucratif pour ses dirigeants, qui ont souhaité innover et acquérir leurs propres sets de données. L’objectif : offrir de nouveaux services à plus forte valeur ajoutée par le biais d’une corrélation entre les données internes de ses clients et des informations externes anonymisées sur le comportement d’achat des consommateurs.

Mais pour passer du concept au déploiement, Quantium a dû faire face à un obstacle de taille : la plate-forme analytique existante. Au fur et à mesure que la complexité et le périmètre de leurs analyses progressaient, la plateforme de base de données existante et l’architecture serveurs ne pouvaient plus faire face à la demande. Quantium a donc eu besoin d’une nouvelle plate-forme analytique reposant sur des serveurs fiables, évolutifs, et hautement performants, ainsi que sur un framework logiciel de classe entreprise.

 

La solution : une distribution Hadoop MapR sur une infrastructure Cisco

Pour relever le défi, Quantium a constitué un groupe de data-scientists afin de créer leur propre cahier des charges et d’évaluer les solutions logicielles et matérielles du marché. « Les décisions concernant la nouvelle plate-forme affecteront nos activités pour les années à venir. Nous avons donc beaucoup investi dans le processus de sélection », commente Alex Shaw, Responsable des opérations technologiques. Quantium s’est rendu compte qu’une solution Big Data était nécessaire non seulement en raison du volume de données, mais surtout pour répondre aux lourdes exigences d’analytique. Après s’être décidé sur Hadoop pour la partie logicielle, s’est posée la question de la distribution. Après un POC de trois mois durant lequel différents use-cases ont été testés sur des sets de données et de requêtes réelles, notre partenaire MapR, qui bénéficie du label « Cisco Preferred Solution », a remporté la mise. Niveau matériel, Quantium a souhaité short-lister son fournisseur historique, les équipements Cisco, et un fournisseur OEM de serveurs x86 dit « de commodité ». Si les résultats en matière de performance ont été relativement similaires, les serveurs Cisco UCS ont fait la différence tant sur leur faible consommation énergétique que sur leurs capacités de gestion centralisée.

 

Le portefeuille de Quantium se développant rapidement, l’entreprise a dû augmenter sa capacité de calcul en conséquence. L’architecture en cluster de la nouvelle plate-forme lui permet d’évoluer facilement, tout en conservant un TCO inférieur aux architectures précédentes : Quantium pouvant affiner son niveau de performance par un simple ajout de serveurs au cluster, sans avoir besoin de les remplacer par des modèles plus puissants. Comparativement, les outils de gestion de la plateforme Cisco/ MapR réduisent jusqu’à 30% les délais d’administration d’un système multi-tenant, où les données provenant de plusieurs clients résident sur un même cluster. Si l’approche « multi-tenant » réduit les coûts et optimise l’utilisation du matériel, elle introduit un risque d’accès non autorisé à l’information par d’autres utilisateurs du même cluster. « Pour garantir la sécurité des données de nos clients, nous nous reposons sur les fonctionnalités telles que le partitionnement de données qui permet de séparer logiquement les sets de données tout en optimisant le stockage », précise Alex Shaw.

 

Des performances qui dépassent les objectifs définis

Au cours de la rédaction du cahier des charges, Quantium s’est fixé comme objectif une augmentation de ses performances par un facteur dix. Cet objectif a été largement dépassé puisque la plateforme Ciso/MapR affiche une diminution du temps de traitement des requêtes de 92%, soit une progression en termes de performances par un facteur 12,5. La performance est cruciale pour Quantium qui souhaite fournir des résultats complets et rapides à ses clients. « Le fait d’accéder à des sets de données externes, que nous combinons aux données apportées par nos clients, nous confère une position unique sur le marché ». Alex Shaw détaille : « Une enseigne retail peut disposer d’une image assez bonne du comportement de ses clients dans ses propres magasins, mais connaît-elle la fréquence à laquelle ses clients achètent chez un concurrent ? En faisant se rejoindre des données concernant la consommation en magasin ou en ligne, avec des habitudes de consommation en matière de media, nous sommes capables de rendre les campagnes publicitaires plus efficaces. »

 

A mesure que les sets de données ont augmenté et que l’analytique s’est faite plus complexe, les méthodes d’échantillonnage sont devenues plus longues et compliquées. Mais grâce à la nouvelle solution Cisco/MapR, les data scientists peuvent dorénavant concevoir des requêtes complexes, les exécuter sur des volumes de plusieurs Terabytes, et obtenir des résultats plus précis en quelques minutes à peine. En permettant de tester des scénarios alternatifs rapidement et avec précision, et en raccourcissant les délais de développement, la plateforme contribue à favoriser l’innovation. « Nous avons beaucoup de gens intelligents mais qui ont été handicapés par la technologie et son incapacité à accompagner et à mettre en œuvre leurs idées. Maintenant qu’ils ont amélioré la façon de procéder à nos analyses, nous ouvrons la voie à la création de services nouveaux et innovants » conclue Alex Shaw.

 

Pour en savoir plus

Les solutions Cisco pour Big Data, visitez : cisco.fr/big-data