SKAPÁNê

Morgane WINTERHOLER

CEO & Co-founder

+33(0)6 20 40 94 44

www.skapane.com

Analytique

API

Applications

Dataviz

Infrastructure

Institutionnels

Consultants/SSII

Intégrateurs

Retours d’experiences projets de machine learning

 

Analyse sémantique pour constitution automatique de paniers personnalisés

 

L’optimisation des ventes sur un site marchand passe par la fluidité du parcours client. En effet, la rapidité du processus de commande est un des facteurs essentiels de fréquentation des sites marchands généralistes, notamment alimentaires. Au-delà des fonctions de base comme la liste de courses habituelles, les fonctionnalités avancées permettant de faciliter la constitution de panier sont reconnues comme des leviers d’augmentation des ventes. Un usage possible consiste à proposer aux clients
de choisir une recette de cuisine qu’ils souhaitent préparer, et d’ajouter automatiquement la liste
des produits nécessaires dans son panier d’achats.

 

La technologie de SKAPÁNÊ utilise un réseau de neurones capable de construire un modèle sémantique sur la base d’un corpus de recettes de cuisine. L’algorithme mis en œuvre est ensuite capable d’associer des mots ayant le même sens même sans aucune racine lexicale commune. La portée de cette approche est importante, car il s’agit d’une technique d’apprentissage non-supervisé, ne nécessitant pas l’intervention humaine. Au-delà des aspects technologiques, la solution prend en compte des aspects métiers liés au commerce en ligne :

 

  • Produits de substitution en cas de rupture de stock ou d’absence du produit dans le catalogue,
  • Priorité est donné aux produits à plus forte marge,
  • Gestion des quantités afin de constituer un panier complet,
  • Personnalisation des produits en fonction des habitudes de consommation du client, en intégrant
    son historique de consommation : marque de prédilection ou types de produits (bio par exemple).

 

La performance de calcul autorise le déploiement complètement on-line, permettant au client de choisir une recette en ligne, son panier étant automatiquement constitué. Il est également possible de « deviner » les recettes possibles sur la base d’un panier en cours de constitution et de proposer des produits complémentaires pour compléter la recette, ou des produits d’accompagnement (vins associés
ou « petite touche » supplémentaire pour une recette).

La qualité de la solution est assurée par un contrôle des résultats sur la base du catalogue
du e-commerçant.

 

Ces solutions font partie des outils facilitant le parcours d’achat des clients, en incluant la personnalisation client par client, et pas uniquement par catégories de clients. L’enjeu est la fidélité
des clients, la mise en avant de produits et l’up-sell de produits compagnons. L’infrastructure logicielle nécessaire est complètement standard : utilisation de Spark (MLlib) et s’intègre avec toutes les solutions de e-commerce via des APIs de type REST (WebServices). Cette technologie est disponible sous forme
de logiciel installé sur le site ou en mode SaaS.

 

 

Sécurisation du paiement en un click sur les sites marchands grâce à l’apprentissage automatique en temps réel

 

Le taux de fraude moyen sur les sites marchands français impose l’utilisation de solutions de sécurité renforcée. En effet, avec un chiffre au-dessus de 0,20% des transactions, le préjudice financier potentiel est important. Les solutions d’authentification forte répondent très bien à la problématique de sécurisation. Comme toute technique de sécurité, elle amène néanmoins des contraintes et n’est pas capable
de détecter tous les types de fraude. En effet, la nécessité de confirmer un paiement par un code envoyé
par SMS ou message sur smartphone, ou l’utilisation de boitiers personnels de sécurité, voire de matrices
de codes, est connue pour provoquer des abandons de panier : rallongement du temps de commande,
non disponibilité du dispositif de sécurisation, …  D’autre part, sur certains types de paiement (plusieurs fois sans frais), la sécurisation ne couvre que la premier des paiements. Il est donc intéressant
de compléter la sécurité du paiement en tant que tel par un outil de détection du risque de fraude
à la sortie du tunnel de commande. Cette approche permet de choisir le type de paiement proposé
au client (paiement sans autorisation, autorisation, autorisation 3DS, contrôle manuel de la commande, contrôle avec contact client, refus, …) à la validation du panier.

 

La technologie de SKAPÁNÊ s’appuie sur un des algorithmes les plus puissants dans ces domaines : les forêts aléatoires (Random Forests). Sur la base de l’historique des commandes, un algorithme de détection des comportements et des caractéristiques des achats est calculé, permettant d’estimer en temps réel un niveau de risque de fraude pour la commande en cours. La solution est complétée par un moteur de règles métiers permettant aux gestionnaires de sites et au gestionnaires de fraude de contrôler le comportement dynamique du système en y adjoignant des règles métiers spécifiques (contrôle systématique au-dessus d’un certain montant, ou pour certains types de produits, modulation du risque par la marge du panier
en cours, …) ainsi que d’indicateurs temps réel des choix de routage effectués par le système.

 

L’amélioration de qualification de transactions potentiellement frauduleuses permet  au système de vente de faciliter l’expérience utilisateur des clients en identifiant précocement les transactions à risques
et ainsi simplifier le processus de paiement des clients à faible risque en allant jusqu’au paiement en
1 click pour la plus grande proportion possible des transactions.

 

L’infrastructure logicielle nécessaire est complètement standard : utilisation de Hadoop, Spark (MLlib) d’une base de données NoSQL haute performance (Aerospike) et s’intègre avec toutes les solutions
de e-commerce via des APIs de type REST (WebServices).

Cette technologie est disponible sous forme de logiciel installée sur le site ou en mode SaaS.

 

 

SKAPÁNê

José

Corral Gallego

COO - Co-Fondateur

interview

Qui est SKAPÁNÊ ?

SKAPÁNÊ est une start-up innovante spécialisée dans les traitements big data en temps réel et le Machine Learning, accélérée dès son lancement début 2015 au sein d’Euratechnologies à Lille. Notre vocation
est d’apporter à nos clients la haute technologie de la prédiction, de la recommandation produit, de la classification clients, de la lutte contre la fraude, de l’analyse sémantique et du marketing relationnel.

Une de nos différentiations réside en notre capacité à intégrer ces technologies de pointe en temps réel

au sein des chaînes transactionnelles quand le marché le propose principalement sous forme de rapports d’analyse ou au mieux d’intégration batch. Notre démarche consiste à rester pragmatique et à mesurer des résultats à chaque étape : analyse stratégique, formation, mise en œuvre de pilotes, de projets, exploitation … Nous proposons un accompagnement agile de bout en bout en bout dans la mise en œuvre d’algorithmes sophistiqués dont la puissance permet de traiter des énormes volumes de données disponibles mais encore inexploitées : données internes, externes, open data...

 

Quels sont les types de projets que vous réalisez ?

Actuellement nous menons des projets très variés. Nous formons beaucoup de data scientists au traitement des données volumineuses avec Hadoop & Spark par exemple chez Axa, Cofidis, MonaBanq

ou Oney Banque Accord. Nos formations sont très appréciées car nous y intégrons beaucoup de pratique, les stagiaires manipulent leurs propres données et nous leur mettons ainsi le pied à l’étrier pour intégrer un projet de datascience. A la suite des formations, nous continuons d’accompagner ces clients sur leurs projets. Nous formons ou plutôt coachons  également des membres de comités de direction et des managers qui ont besoin d’être accompagnés à la transformation numérique sur la dimension de la gestion de la donnée, et notamment de la donnée volumineuse ou non-structurée. Bien évidemment nous menons des projets de Machine Learning pour le compte de nos clients. A titre d’exemple,  nous réalisons pour C Discount un projet de lutte en contre la fraude en Apprentissage Automatique : l’analyse du comportement des clients sur le site via des algorithmes de Machine Learning mis en place par SKAPÁNÊ permet de définir un score de risque de fraude et ainsi d’autoriser le paiement en un click pour les bons clients, augmentant ainsi le taux de transformation. Pour Auchan Retail data, nous réalisons un projet de constitution automatique de paniers basé sur de l’analyse sémantique de recettes de cuisine.

 

Parlez-nous de votre plate-forme Cloud

Effectivement, nous mettons également en œuvre des projets en mode Cloud, c’est par exemple ce que nous réalisons dans le mode de la connaissance clients. Nous opérons pour le compte d’un de nos clients du monde du Marketing Relationnel une plate-forme de comptage et d’extraction à des fins de télémarketing. Dans ce cas SKAPÁNÊ développe et d’exploite la base de données contenant plus de 40 millions d’individus, et un peu moins de 100 millions de contacts (adresse postale / e-mail/ tel fixe,

tel mobile). La plate-forme permet d’extraire des listes de contacts sur la base de critères simples (localisation géographique par exemple), complexes (profil client sur la base de ces achats / prédiction d’intentionnistes / détection d’évènements de vie …) ou issus de l’Open Data (données du recensement de la population par exemple). Sur cette plate-forme, nous réalisons aussi des projets de connaissance clients pour Cofidis : analyse de la navigation des clients et prospects sur le site web, analyse des messages reçus et tri automatique par nature, urgence… L’offre en mode Cloud est une offre que nous souhaitons développer car elle permet à nos clients de lancer des pilotes, des expérimentations …. Afin de tester

des usages et de démontrer les apports de ces technologies dans leur business. C’est une approche

très pertinente dans notre domaine, où l’agilité et la rapidité sont clés.

 

Et dans le cas du mode Cloud, où sont les données ?

Bien sûr, notre plate-forme, et donc les données, est localisée dans un Datacenter extrêmement sécurisé, bénéficiant des certifications PCI DSS du monde du paiement et HADS du monde de la santé, situé dans les Hauts de France. Il n’est pas question pour nous de mettre les données de nos clients ailleurs qu’en France.

Nous veillons également à ce que tous les aspects légaux et juridiques soient respectés : déclarations CNIL, protection des données personnelles…

 

Quelles sont les technologies de référence chez SKAPÁNÊ ?

La vague de développement de logiciels d’infrastructure Open Source est particulièrement réussie

sur le monde du Big Data et du Machine Learning. Plusieurs solutions de référence de grande qualité sont disponibles. Nous avons choisi Hadoop et Spark pour le stockage distribué sécurisé et les traitements distribués. Nous utilisons les bases de données NoSQL du marché : HBase, Cassandra  pour les bases orientées colonnes ou Aerospike pour les besoins de performance temps réel. Spark, particulièrement depuis la version 2.0, propose une librairie très complète sur les algorithmes de Machine Learning modernes. Nos plateformes en production nous ont permis de démontrer la qualité, la production sécurisée et le coût de possession attractif de ces solutions.

 

Quelle est votre vision pour SKAPÁNÊ ?

Nous souhaitons aider à la mise en œuvre de solutions de traitements de données et de Machine Learning en France et en Europe. En effet, il s’agit là d’un des piliers de la transformation numérique, qui nous semble encore peu développé sur le vieux continent. Nous espérons contribuer à la formation d’ingénieurs experts, de Datascientists et à l’introduction de ces technologies dans tous types de projets d’entreprises, car elles ont démontré leur capacité à amener certaines des start-ups de la Silicon Valley à devenir

des géantes aujourd’hui.