EBIZNEXT

Nadine CORON

Directrice associée

 

+33 1 56 89 00 00

Analytique

API

Applications

Dataviz

Infrastructure

Institutionnels

Consultants/SSII

Intégrateurs

EBIZNEXT, ACTEUR DE RÉFÉRENCE DANS LA FAST DATA

ebiznext s’est forgée une solide expérience dans la transformation digitale de ses clients, grâce à la complémentarité de ses consultants spécialisés dans la « fast data », de ses experts technologiques et de ses Data Scientists.

 

Au travers d’une démarche itérative et pragmatique, l’équipe ebiznext accompagne depuis plusieurs années ses clients dans la mise en œuvre de solutions destinées à approfondir la connaissance de leurs marchés (BtoB, BtoC, BtoBtoC…) et maximiser ainsi leur performance digitale.

ebiznext conseille et met en place une offre innovante de Datalake à la carte (de type DMP pour les marketeurs) qui s’appuie sur des technologies à la fois modernes et éprouvées : Spark / Mesos / Akka / Couchbase / Kafka.

 

À titre d’exemple : ebiznext a conçu et mis en place un Datalake industrialisé apte à répondre à des cas d’usages nécessitant des données capturées, traitées et diffusées en temps réel.

 

PROJET FAST DATA

L’objet de ce projet est de réaliser des calculs de mesures d’audiences à partir de données issues de différentes plateformes digitales (portail entreprise, réseaux sociaux, etc.)

 

L’architecture fonctionnelle se décompose comme suit :

  • les services de mesure chargés de collecter la donnée,
  • les services métiers chargés de calculer les agrégats à la volée et de persister les données en base,
  • les services de présentation chargés de restituer les indicateurs aux utilisateurs finaux.

 

 

PRÉCONISATION D’ARCHITECTURE

Nous proposons une architecture sur la base de briques OpenSource.

Celle-ci permet, dans une approche Fast Data, de :

  • répondre à des problématiques de forte volumétrie et de garantie de résilience aux pannes,
  • restituer « au plus tôt » des indicateurs.

 

L’architecture applicative générique ci-dessous appliquée par ebiznext dans le cadre de ses projets se décompose en trois phases qui correspondent comme suit aux services fonctionnels attendus :

  • les services de mesure sont implémentés par la couche de capture des événements,
  • les services métiers sont implémentés par la couche de traitement des données,
  • les services de présentation sont implémentés par la couche de présentation.

 

Capture des événements (services de mesures)

Les points de vigilance sont les suivants :

  • Sécurité : s’assurer que les composants clients sont autorisés à émettre des messages vers le Datalake.
  • Validité des données : s’assurer que les schémas des événements transmis par les composants respectent le schéma de données attendu par le Datalake.
  • Performance : s’assurer qu’un pic d’émission d’événements ne va pas perturber les traitements

 

La suite Confluent incluant le middleware Kafka, un schéma registry et un proxy HTTP/REST, répond aux problématiques listées ci-dessus.

 

Traitement des données (services métiers)

Nous proposons un pipeline de traitement basé sur le framework Kafka Streams de la plateforme Confluent.

La framework Kafka Connect est mis en place pour pousser ces agrégats vers une ou plusieurs bases tel que Elasticsearch ou encore vers le système de fichiers distribués tel que HDFS.

 

Diffusion de la connaissance (Portail utilisateurs)

Les informations métiers sont ensuite diffusées via une API de présentation ou un outil de DataViz.

 

CONTRIBUTIONS EBIZNEXT

Parallèlement à la réalisation de projets fast data, les consultants ebiznext animent différents types d’événements :

  • talks et workshops (ScalaIO, Devoxx, PSUG, JUG, Data Marketing Paris…),
  • meetups intra-entreprises et hackathons (thématiques : IoT, Machine Learning…),
  • formations qualifiantes (Data ScienceTech Institute, ENSAI, Centrale Paris…),
  • formations certifiantes (Lightbend, Couchbase…).

 

ebiznext apporte par ailleurs des contributions majeures sur

blog.ebiznext.com et github.com/ebiznext.