HURENCE

Laurence Hubert

CEO

+33 4 76 08 70 89

www.hurence.com

Analytique

API

Applications

Dataviz

Infrastructure

Institutionnels

Consultants/SSII

Intégrateurs

Vous avez maintenant l’habitude qu’à chaque nouvelle édition du Guide du Big Data, Hurence vous présente ses travaux phares de l’année. Cette année nous avons travaillé de manière récurrente sur une problématique très courante pour la plupart de nos clients qui évoluent dans le e-commerce.

 

Comment récupérer les données détaillées de navigation Web tout en conservant les indicateurs standards chez Google Analytics ?

L’objectif est de récupérer ces données pour les mettre dans le Data Lake et les enrichir, ceci pour de multiples raisons. Une première raison est tout simplement liée à la réappropriation des données. Nos clients souhaitent avoir un accès total à leurs données (Google ne restituant qu’une vision partielle et/ou agrégée des données de navigation, et non pas l’ensemble des données brutes). Ils souhaitent également pouvoir mieux contrôler et protéger ces données business qui leur sont propres. La seconde raison consiste à mettre en place un traitement analytique en temps réel. Des recommandations / informations contextuelles sont proposées instantanément à l’utilisateur suivant son comportement. Ces contenus sont produits en temps réel à partir des données de l’utilisateur et de l’entreprise (en fonction des besoins, des marges, des stocks, des partenariats en cours, ...). Le troisième objectif vise à analyser les raisons de l’échec d’une vente, et à connaître les données qui ont manquées à l’utilisateur pour la concrétiser. D’où l’intérêt de rapatrier ces données de navigation pour les croiser et les enrichir avec d’autres sources de données externes/métiers (ERP, PIM, base utilisateur, infos concurrentielles ...).

 

Nous avons mis en place des chaînes de traitement basées sur notre produit open source LogIsland pour permettre la récupération temps réel des données de navigation tout en en conservant une partie chez Google Analytics. Le site Web de l’entreprise n’est pas modifié car nous utilisons le même tag manager que pour Google Analytics (Google Tag Manager) : les instructions d’envoi d’évènements alimentent à la fois Google et le Data Lake de façon transparente. Ceci a permis à nos clients de rendre leurs sites Web beaucoup plus réactifs (très proche de ce que fait Amazon), pour exploiter au mieux les opportunités de vente. Il est important de détecter qu’un utilisateur a une intention d’achat et n’arrive pas à la concrétiser.

 

Nous avons implémenté ces projets sur la base de notre outil LogIsland, capable d’analyser des logs aussi bien pour le web analytics que pour la cyber-sécurité, l’IoT, et l’Usine du futur (aussi appelée Industrie 4.0). Nous pouvons décliner cette solution au-dessus de n’importe quelle infrastructure Big Data des clients classiques de Hadoop. Il existe d’autres possibilités d’implémentation mais la nôtre a l’avantage d’offrir un grande facilité d’utilisation (avec des composants clefs en main). Elle est de plus extensible (plugins java), libre et en open source.

 

LogIsland, la scalabilité d’une solution Big Data clé en main

Nous utilisons Kafka pour la gestion des événements et des alertes et Spark Streaming pour l’analyse en temps réel des logs ou autres données. Grâce à ses plugins dédiés, LogIsland s’intègre parfaitement à votre cluster Big Data Hadoop et à votre moteur de recherche ElasticSearch, sans dépendance. LogIsland peut collecter vos logs à travers Nifi ou Logstash ou tout autre ETL, déverser ces logs dans votre Data Lake, les faire indexer à des fins de recherche, en plus de les analyser à la volée et les transformer en événements ou alertes. LogIsland peut même directement récupérer des événements par protocol IoT standard ou, comme nous l’avons vu plus haut, via un Tag Manager pour le web analytics. Il est scalable grâce à Spark; ses performances sont incomparables, son architecture offre un énorme potentiel.

 

L’approche Hurence est très pragmatique

Elle part de la problématique de nos clients qui consiste souvent à optimiser les ventes et faire en sorte que l’expérience utilisateur du site web soit la plus personnalisée possible. Les utilisateurs sont uniques et il est nécessaire d’anticiper leurs besoins (que l’on a pu prédire) pour que l’expérience de navigation soit simplement extraordinaire.

 

La force de Hurence c’est de projeter la vision Big Data de l’entreprise sans se bloquer sur les aspects stratégiques avec une première implémentation novatrice. LogIsland pose ainsi les bases d’un futur beaucoup plus temps réel et beaucoup plus réactif, une première étape incontournable.

 

 

Plus d’informations sur hurence.com