BEARINGPOINT

Thierry LALANDE

Senior Manager

+33 (0)1 58 86 30 00

www.bearingpoint.com

Analytique

API

Applications

Dataviz

Infrastructure

Institutionnels

Consultants/SSII

Intégrateurs

Amélioration de la lutte contre la fraude grâce au Big Data

Une collaboration de la CNAMTS et de l’équipe Data & Analytics de BearingPoint

 

 

À propos de la Caisse nationale de l’assurance maladie des travailleurs salariés (CNAMTS)

 

La Caisse nationale de l’assurance maladie des travailleurs salariés (CNAMTS) définit la politique de l’assurance maladie en France et pilote les organismes chargés de la mettre en œuvre. Elle assure notamment la gestion des facturations de l’ensemble des 90 familles de professionnels de santé (infirmiers, cardiologues, pharmacies, laboratoires…) et effectue des contrôles pour chacune d’elles,
afin de vérifier la réalité des prestations facturées et, en cas de fraude, entamer des poursuites
contre le professionnel de santé.

 

L’objectif principal de la CNAMTS est, au moyen de contrôles contraints, d’augmenter significativement
la proportion de contrôles positifs – soit ceux qui permettent de détecter des comportements frauduleux.

 

Afin de répondre à cet objectif ambitieux, la CNAMTS a mis en place des méthodes statistiques
de « datamining raisonné » depuis 2006, permettant d’optimiser la détection de fraude.

Bien que performantes sur les cas de fraude les plus aberrants, elles ne permettent toutefois pas de faire ressortir des profils de fraudeurs plus discrets. Or, la CNAMTS s’est rendu compte que les profils des fraudeurs tendaient à évoluer et à se complexifier au fil des contrôles, ce qui les rendrait plus difficilement identifiables par les méthodes de datamining raisonné.

 

C’est ainsi dans une démarche d’innovation qu’elle a décidé d’entreprendre un projet d’expérimentation avec HyperCube®, la solution d’analyse de données de BearingPoint, afin d’anticiper cette évolution
en explorant les cas de fraude moins flagrants.

 

 

Des résultats mesurables et concrets

L’étude menée par la CNAMTS avec HyperCube® en 2014 a consisté à identifier les profils à risque, parmi la famille des infirmiers, sur base des contrôles effectués les années précédentes.

 

Les règles d’HyperCube® ont servi de base à des contrôles réalisés sur le terrain, parmi les infirmiers installés et exerçants en activité. En partant d’un taux de fraude très bas (0,7 % de fraudeurs constatés),
il fallait concentrer le phénomène afin de gagner en sensibilité et ne pas lancer les contrôleurs sur
des pistes inutiles.

 

Les profils identifiés par ces règles comprenaient une proportion de fraudeurs plus de cent fois plus importante que le taux moyen constaté.

Suite à cette expérimentation « analytique », la CNAMTS a mené en 2014 et 2015 plusieurs dizaines de contrôles à partir de deux profils. Elle a ainsi constaté par rapport à la population contrôlée un taux
de fraude avérée de 70 %
et des redressements moyens approchant les 40 000 euros par fraudeur.

 

Ces résultats finaux démontrent la stabilité dans le temps et la rentabilité des résultats obtenus avec
des méthodes de « machine learning » telle qu’HyperCube®. Il a été constaté que les résultats obtenus avec cette méthode permettaient de cibler beaucoup plus précisément la population à risque qu’avec d’autres méthodes de « datamining supervisé » que la CNAMTS a par ailleurs également expérimentées.

Il est ainsi prouvé que l’utilisation de nouveaux algorithmes de data science (ou machine learning),
pour identifier les cas de fraude, permet au contrôleur d’améliorer de façon conséquente ses ciblages
et son efficacité sur le terrain.

 

 

Les facteurs clés de succès en 4 points

 

  • La structuration d’une base de données qui reflète le mieux possible le profil de chaque infirmier
    et les caractéristiques de son activité déclarée. À ce titre, les équipes de la CNAMTS, autour du docteur Pierre Fender, directeur de l’audit, du contrôle-contentieux et de la répression des fraudes, se sont attachées, pendant plusieurs semaines, à collecter et structurer les données pertinentes venues
    de nombreux systèmes d’information de la CNAMTS. Variables et facteurs influents.
  • Le travail collaboratif des experts fraude de la CNAMTS et des datascientists d’HyperCube®. Ce travail a permis, dans un premier temps, d’identifier et de prioriser les données à collecter et, dans un second temps, de sélectionner les profils opérationnellement pertinents parmi les profils mathématiquement fraudeurs.

 

  • Le caractère « explicatif » et « prédictif » de l’algorithme de machine learning HyperCube®.
    Cet algorithme est capable de trouver des phénomènes locaux très petits et de les exprimer
    sous forme intelligible à des experts de la fraude qui ont pu s’attacher à comprendre les profils
    « mathématiques » et à les interpréter en comportements frauduleux. Cette étape de validation humaine du modèle est particulièrement importante pour la CNAMTS qui doit pouvoir justifier à tout moment les raisons d’une action publique. Ainsi les modèles prédictifs « boîte noire » comme ceux basés sur des « réseaux de neurones » ou des « forêts d’arbres décisionnels » n’apportent pas
    la transparence nécessaire.

 

  • La rigueur opérationnelle de la CNAMTS qui a initié des tests importants sur le terrain. Elle a d’abord lancé en quelques mois plusieurs dizaines de contrôles à partir des profils identifiés, puis elle a attendu la réalisation de l’ensemble de ces contrôles, qui peuvent parfois durer plusieurs mois, enfin elle a fait le bilan des résultats de ces contrôles en termes de taux de fraudeurs constatés
    et de montants moyens de l’amende.

 

Pour de plus amples informations : cliquez ici