BMB SERVICES

Yann MANEIX

+33 6 31 70 74 65

www.bmb-services.com

Analytique

API

Applications

Dataviz

Infrastructure

Institutionnels

Consultants/SSII

Intégrateurs

BMB Services est un cabinet de conseil qui accompagne ses clients dans la transformation du système d’information autour des innovations SAP.

Des entreprises utilisatrices nous sollicitent aujourd’hui dans l’élaboration de cas d’usage, ou dans la mise en œuvre de prototypes sur des scénarios à conceptualiser.

 

A ce jour, la mise en œuvre de plateformes Big Data en est encore à ses débuts et se matérialise souvent par des besoins de « data tiering » (gestion de données « chaudes » versus données « froides ») ou de croisement des données structurées et non-structurées.

 

Dans ce contexte de forte volumétrie, et afin de limiter l’empreinte du stockage sur la base de données SAP HANA adossée à son ERP, l’un de nos clients nous a mandaté pour définir une architecture qui permette la réplication de données les plus anciennes du système SAP ECC vers un datalake Hadoop.

 

Cette architecture doit permettre :

 • de répliquer les données historiques

 • un accès simple et instantané à ces données

 • une maîtrise des coûts contraint par le modèle de licensing SAP HANA.

 

Pour cela 3 scénarios ont été proposés et des maquettes réalisées pour évaluer la solution la plus adaptée.

Il est à noter que les choix d’architectures retenus étant liés aux contraintes et à l’historique du client, ces options pourraient être différentes dans un autre contexte.

 

 

Scénario 1 : Flux en deux étapes

Le premier scénario consiste en la connexion d’un système SAP ECC vers une base de données relationnelle intermédiaire en mode Change Data Capture (CDC) puis réplication vers Apache HBase.

 

 

Le prototype a permis de mettre en avant les avantages et les inconvénients de cette architecture. Elle a l’avantage de fournir un mécanisme natif de réplication des données en mode temps réel. Elle permet également la réplication automatique des structures.

Néanmoins, l’absence de connecteur SAP natif vers le monde Hadoop nécessite une étape intermédiaire.

 

 

Scénario 2 : SAP HANA vers Hadoop

Le deuxième scénario consiste à utiliser les mécanismes de connexion natifs de SAP HANA (Smart Data Integrator/Smart Data Access) vers Hadoop en mode temps réel.

 

 

Cette solution permet une simplification de la mise en place en raison de la présence de connecteurs Hadoop au niveau de la base HANA.

En revanche, la complexité de la matrice de sécurité ainsi que l’obligation d’existence des tables à répliquer dans l’environnement cible constituent des points négatifs.

 

 

Scénario 3 : SAP ECC vers Hadoop

Le troisième scénario consiste en la connexion d’un système SAP ECC vers une cible HDFS (ou Hive), avec une réplication des tables métiers SAP vers Hadoop au travers de SAP Data Services.

 

 

La solution SAP Data services permet de se connecter en standard à des sources et des cibles SAP et non SAP, ce qui constitue un réel avantage.

Nonobstant cette technologie s’avère complexe à mettre en œuvre pour des flux en temps réels.

 

La flexibilité offerte par Hadoop permet aujourd’hui de répondre à différents besoins métiers. La conceptualisation et la mise en place des architectures big data reste fortement contrainte par les contextes du client.