INDEXIMA

Emmanuel Dubois

Directeur commercial

06 12 32 19 46

www.indexima.com

Analytique

API

Applications

Dataviz

Infrastructure

Institutionnels

Consultants/SSII

Intégrateurs

MAPPY NE FAIT PLUS DE COMPROMIS ENTRE COÛT, PERFORMANCES ET VOLUMÉTRIE GRÂCE À INDEXIMA

Spécialiste du calcul d’itinéraire et des services de cartographie, Mappy est reconnu comme le leader français de la recherche locale par la carte sur Internet, mobiles et tablettes.

Comme dans toutes les organisations, mieux comprendre ses services est un enjeu majeur les différentes directions fonctionnelles de Mappy.

Par exemple comprendre finement le comportement de ses utilisateurs pour la direction marketing afin de proposer des offres adaptées ou optimiser le parcours client. Mettre en place des KPIs pour la direction technique pour optimiser les performances ou défaillances potentielles en production.

Depuis plus de deux ans et grâce à Indexima les équipes marketing de Mappy peuvent désormais suivre et analyser, l’ensemble des visites sur les différents produits avec une finesse jamais obtenue auparavant.

 

UNE CHAINE BI TRADITIONNELLE TROP RIGIDE ET COÛTEUSE

Avant 2014, l’infrastructure BI offrait peu de flexibilité et d’agilité dans l’analyse : cela entrainait de nombreux aller-retour entre les métiers et l’équipe informatique pour obtenir les statistiques d’usage en amont des axes d’analyses à analyser. Il fallait attendre un temps important avant de pouvoir analyser les usages. D’autre part, l’information ainsi agrégée perdait en précision et cela limitait les analyses.

 

Cette architecture BI reposait sur des traitements développés en Python pour gérer les 200 Go de log quotidiens enregistrés par les 700 serveurs en production. Stockés dans Microsoft SQL Server, les quelques 10 millions de lignes de statistiques étaient présentées via des cubes et consommées avec Excel.

 

INDEXIMA APPORTE SIMPLICITÉ ET ÉCONOMIE EN CAPEX ET OPEX POUR L’IT ET AGILITÉ POUR LES ANALYSTES

Le premier chantier fut de monter une infrastructure de stockage de masse : Hadoop fut privilégié. Puis le choix d’une solution datavisualisation pour entrer dans l’ère de la BI self-service. Guidé par un choix de conserver toute la richesse des logs. Les analyses n’ont alors plus de limites et les lignes de statistiques se démultiplient. Courant 2015, la donnée agrégée dépasse le milliard de lignes.

 

UNE SOLUTION BLUFFANTE PAR SA TECHNOLOGIE

C’est alors que se pose deux sérieux problèmes.

Les requêtes générées par la BI self-service sont coûteuses, surtout lorsque la stratégie d’exécution se base sur des principes de « full scan ». Demander aux analystes de patienter plusieurs minutes ou plusieurs heures avant d’avoir la réponse à leurs interrogations devient intolérable. D’autre part, stocker de grands volumes de données est une chose mais dépenser des fortunes en mémoire et en serveur pour assurer la performance n’est pas une option.

Les solutions existantes pour améliorer cette performance sur les volumétries de Mappy ne se sont pas révélées satisfaisantes. Celles s’appuyant sur des concepts similaires aux cubes étaient trop peu flexibles pour les utilisateurs métiers, celles reposant sur des traitements massivement parallèles étaient trop chères pour la DSI.

 

L’équipe BigData de Mappy était au pied du mur. La solution BI répondait aux besoins d’agilité et de finesse de ses données mais avec des problèmes de performance sur Hadoop qui semblaient insurmontables.

 

« IL Y A UN AVANT ET UN APRÈS INDEXIMA »

 

C’est en testant Indexima que Mappy a enfin pu lever ce conflit FLEXIBILITE / COUT / PERFORMANCE. Les temps de réponse d’affichage sont retombés en dessous de la centaine de millisecondes.

En combinant trois innovations : des hyper Index, un moteur Orienté Colonne distribué et un mécanisme de génération automatique des Hyper Index, Indexima adresse l’analyse de très gros volumes sans rogner sur les performances. Elle apporte à Mappy toute la souplesse et la finesse dont elle avait besoin, sur une infrastructure très raisonnable. En 2017, les collaborateurs Mappy utilisent leur outil d’exploration de données sur plus de 25 milliards de lignes, sur un cluster de 6 machines.

 

L’accès à la donnée est quasi instantané : les requêtes SQL sont exécutées en moins de 100 ms.

L’infrastructure est totalement scalable et peu coûteuse : Indexima est installé sur 6 serveurs du cluster Hadoop et supporte l’analyse du parcours des 12 millions de visiteurs uniques et 5 millions de points d’intérêt. La volumétrie des données générées a été multipliée par 25 en moins de deux ans, sans le moindre ajout de serveur de calcul. Le ROI est immédiat, surtout comparé à des solutions de type Spark qui nécessiteraient 1000 fois plus de machines.

Et pour une qualité de service à l’utilisateur incomparable : chaque analyste peut croiser les données qu’il souhaite et obtenir des réponses immédiates sur l’ensemble des données de masse.

Enfin la préparation de donnée est également facilitée puisque qu’il n’y a plus besoin de couches multiples de datamart.

 

INDEXIMA, UN ÉLÉMENT CLÉ POUR L’EXPLOSION DES DONNÉES ENCORE À VENIR

Indexima a permis à Mappy d’accélérer sa propre roadmap et le développement de son équipe Big Data. Les collaborateurs de Mappy n’hésitent pas à parler d’un changement de métier et d’une nouvelle façon de voir le big data et la BI.

 

Indexima est devenu un élément clef de l’architecture BI de Mappy, et permet d’appréhender sereinement l’arrivée des centaines de To de données à venir, sans surprise.

 

« Nous n’avons toujours pas atteint les limites d’Indexima, nous n’avons même pas complètement cerné l’ensemble du potentiel et de la puissance de la solution. Aujourd’hui il n’y a plus aucune limite aux questions que l’on peut se poser autour des données et de la BI (des questions et des challenges que l’on n’osait pas se poser par le passé). Indexima a révolutionné notre état d’esprit ! »