NEO TECHNOLOGY

Cédric FAUVET

Business Développement France

+33 (0) 8 05 08 03 44

Analytique

API

Applications

Dataviz

Infrastructure

Institutionnels

Consultants/SSII

Intégrateurs

COMMENT NEO4J A AIDE A TRAITER LES DONNEES « PANAMA PAPERS » LA PLUS GROSSE FUITE DE DONNEES FINANCIERES DE L’HISTOIRE

 

Le Consortium International de Journalistes d’Investigation (ICIJ) a utilisé la base de données de graphes  Neo4j pour analyser ce qui est considéré comme la plus grosse fuite de données financière connue dans l’Histoire.

 

 

Récemment révélée par le Consortium International de Journalistes d’Investigation (ICIJ) l’affaire « Panama Papers » est le scandale qui éclabousse de nombreuses élites mondiales et a mis à jour le système des activités offshore dans les paradis fiscaux.

 

Les données qui ont fuité décrivent les opérations internes du panaméen Mossack Fonseca, l’un des cabinets les plus réputés au monde en matière de création de sociétés offshore. Les 2,6 Téraoctets de données qui composent le dossier ont été obtenues par le quotidien allemand Süddeutsche Zeitung et partagées avec l’ICIJ basé à Washington, qui est un réseau d’équipes d’investigations indépendantes internationales qui collabore avec plus d’une centaine de médias de tous les pays.

 

La pierre angulaire des nombreux scoops révélés par l’ICIJ, à l’image de l’affaire Swiss Leaks, n’est autre que Neo4j. C’est en fait cette technologie de base de données de graphes, utilisée avec la plateforme de visualisation Linkurious, qui a été utilisée pour organiser, orchestrer et rendre intelligibles ces données hautement interconnectées.

 

Un volume de données connectées sans précédent

Selon Mar Cabra, Data and Research Unit Editor de l’ICIJ, l’utilisation de Neo4j était la seule solution viable et disponible pour répondre à ces besoins. « C’est un outil de recherche révolutionnaire qui transforme le processus d’investigation des journalistes car dans ce cas, les relations sont extrêmement importantes puisque ce sont elles qui nous montrent où sont les criminels, qui travaille avec qui, et bien plus encore. Comprendre ces relations à une très grande échelle est précisément là où les bases de données graphes excellent », explique-t-elle.

 

« Avec 11,5 millions de documents à traiter, bien plus que n’importe quelle fuite de données précédente, nous avions donc besoin d’une technologie qui puisse gérer un tel volume rapidement, facilement et de manière efficace », ajoute-t-elle.

 

Ouvrir l’accès aux données Panama Papers pour plus de transparence

Après les différentes révélations faites par l’ICIJ et ayant eu de nombreuses répercussions tant pour des célébrités que des personnalités publiques, le consortium a mis à disposition les données issues des Panama Papers via une application basée sur Neo4j. Les données divulguées contiennent notamment des informations sur plus de 200 000 sociétés offshores étudiées dans le cadre de l’enquête.

 

Avec la mise à disposition de cette application, tout le monde peut désormais accéder d’une part aux données disponibles et visualiser les milliers de structures offshores, d’autre part aux enregistrements internes de Mossack Fonseca dont les noms des vrais propriétaires desdites structures. Propulsée par Neo4j, la base de données interactive comprend également des informations sur plus de 100 000 structures offshores qui figuraient déjà dans des documents dévoilés par l’ICIJ en 2013.

 

La démocratisation de technologies capables de donner du sens à de telles masses de données interconnectées est une composante inéluctable dans une société libre et ouverte, or les bases de données de graphes sont les seules solutions viables lorsqu’il s’agit de donner du sens à des térabits de données connectées entre elles. Elles sont aussi essentielles pour les agences internationales, les gouvernements, les services financiers et les spécialistes de la sécurité à la recherche de la découverte de la vérité.

 

En cela, Neo4j a joué un rôle très important, que ce soit dans les Swiss Leaks ou dans les Panama Papers, et continuera de le faire à l’avenir.

 

De gauche à droite

Stéphane Marlin

Benoît Simard

Cédric Fauvet

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

NEO TECHNOLOGY

Cédric

Fauvet

Business Développement France

 

interview

QUEL EST LE LIEN ENTRE GRAPHES ET BIG DATA ?

 

Les entreprises ont de plus en plus de données à traiter. Elles oublient souvent que la valeur de ces quantités massive de données réside aussi dans les relations qui les unissent. Hors les outils d’analyse des données  SQL ou No SQL classiques ne peuvent traiter les relations dans le volume avec performance et simplicité, ce qui explique le succès de la base de données de graphes Neo4j.

 

VOUS AURIEZ UN EXEMPLE CONCRET A NOUS DONNER ?

 

Bien-sûr. Si l’on prend l’exemple d’HADOOP. Il permet de stocker des logs en grande quantité. Remonter des problèmes présents dans les logs est effectivement très intéressant pour l’entreprise, l’étape suivante est de comprendre pourquoi ces problèmes sont apparus. Une base de données classique ne saura pas analyser la topologie d’un réseau électrique, par exemple, et ainsi ne pourra pas permettre d’identifier les risques de problèmes en cascades. Avec une base de graphes, on a le problème, la topologie du réseau, les interactions entre l’endroit où le problème est apparu et toutes les interdépendances entre cet endroit et les autres éléments. L’entreprise va ainsi pouvoir rapidement résoudre le problème et corriger ce qui doit l’être pour éviter un impact ailleurs.

 

CELA SIGNIFIE-T-IL QUE SELON VOUS LE NOM ‘BIG DATA’ EST SUR-EVALUE ?

 

Non, du tout. Simplement, je pense qu’aujourd’hui, nous abordons en quelques sortes un Big Data 2.0, dans lequel on découvre que les relations entre les données sont plus importantes et génèrent plus de valeur que les données seules. C’est un peu comme si l’on regardait le ciel la nuit, étoile par étoile. C’est intéressant,, mais le ciel prend une autre dimension lorsqu’on comprend comment elles se positionnent les unes par rapport aux autres, permettant ainsi découvrir la Grande Ourse, l’étoile polaire… Mais sans un passage par le Big Data 2.0, nous n’en aurions pas pris conscience.

 

EN SUIVANT VOTRE ANALOGIE SUR LE CIEL, APPARAÎT DEPUIS PEU LA NOTION DE ‘DARK DATA’, VOUS POUVEZ NOUS EN PARLER ?

 

Oui, il s’agit d’une notion qui fait encore l’objet de discussions entre les analystes. Mais de façon générale, il s’agit des données potentiellement utiles qui pourraient être obtenues à partir de processus métier mais qui ne sont actuellement pas mises à profit. Et ces données posent problèmes, puisque le stockage a un coût et stocker des données non utilisées est un gaspillage de ressources. Si l’on tire le fil de cela, on peut estimer que les relations entre les données sont elles-mêmes des ‘dark data’ à l’heure actuelle. En effet, depuis longtemps, on a les outils pour trier et analyser les données. Toutefois, les entreprises ne disposaient d’aucun outil pour traiter les relations entre données. C’est ce qu’apportent les bases de graphes pour ces ‘dark data’ que sont les relations.

 

QUI UTILISE AUJOURD’HUI LES GRAPHES ?

 

Toutes les entreprises qui ont des projets avec des données interconnectées en volume. En effet, vouloir utiliser les graphes quand on n’a que très peu de données n’a pas de sens ; les bases de données traditionnelles font très bien le travail. En revanche, sur des données en nombre, les graphes prennent toute leur dimension et apportent une réelle aide à la décision. Aujourd’hui, par exemple, des entreprises comme LinkedIn, Transparency-One, Ebay, Walmart, Airbus, le groupe Adidas, Meetic ou IDVroom utilisent Neo4j.

 

UN EXEMPLE MARQUANT A NOUS PRESENTER ?

 

Il y en a de nombreux, puisque les graphes sont utilisés dans de nombreuses applications. Un exemple précis et que tout le monde a en tête est la révélation des Panama Papers. On se rappelle que le consortium international des journalistes d’investigation (ICIJ) a mis à jour 2.6 Téraoctets de données concernant des personnes ou sociétés qui faisaient de la fraude fiscale. C’est parce que l’ICIJ a utilisé Neo4j qu’elle a pu traiter et identifier les liaisons entre toutes ces données (personnes, banques, entreprises…).  En effet, ces liaisons ont montré sans équivoque les différentes interactions et participations d’hommes dans des sociétés offshore, et le tout en un temps record.

 

QUEL EST SELON VOUS L’AVENIR DES BASES DE DONNEES DE GRAPHES ?

 

L’avenir des bases de données de graphes est tout simplement qu’elles soient utilisées dans tous les cas où une entreprise a à gérer des grosses quantités de données. D’ailleurs, cela correspond aux prévisions faites par Forrester Research dans une étude récentes : cette année, la part de bases de données de graphes dans l’ensemble des bases de données mondiales devrait atteindre 25%. Et ce n’est que le début.

 

POUR TERMINER, VOUS POURRIEZ NOUS PRESENTER VOTRE SOCIETE, NEO TECHNOLOGY, MEME SI NOUS AVONS BIEN COMPRIS QUE VOUS ETIEZ UN ACTEUR MAJEUR DES BASES DONNÉES DE GRAPHES ?

 

Neo Technology est le créateur de Neo4j, la base de données de graphes leader dans le monde, base de données de graphes native hautement évolutive qui permet de mettre à profit les relations entre les données. Cette technologie aide les entreprises à concevoir et mettre au point des applications intelligentes qui répondent aux besoins actuels et futurs des entreprises comme la détection de la fraude, les recommandations temps-réel, la gestion des données de référence, la sécurité réseau et les opérations des services informatiques.

Avec ses origines Suédoises et son siège social établi à San Mateo en Californie, Neo Technology est présent en Europe et notamment en Suède, en Allemagne, en France et au Royaume-Uni.