FAUT-IL AVOIR PEUR DU BIG DATA ?

LA  DONNÉE ET LE CITOYEN

Il y a eu l’espoir… et puis la méfiance.

Cambridge Analytica, PRISM et – dans un autre registre – l’accident de véhicule autonome d’Uber… les dossiers à charge commencent à s’accumuler contre Big Data, ce « Big Brother » qui ressemble à s’y méprendre à un scénario de Black Mirror. Et il est facile alors de pointer du doigt la menace de l’ombre (comprendre : les GAFA) pour freiner au maximum l’adoption de ces technologies.

 

Pourtant, le Big Data est là, l’IA aussi. Qu’on le veuille ou non, elles sont toutes deux porteuses de changements. Les freiner serait vain, les encadrer nécessaire.

Pour terminer ce panorama du Guide du Big Data, quoi de mieux qu’un peu d’optimisme, de légèreté, de lâcher prise… Le Big Data au service du bien commun.

 

 

La donnée électorale, vrai enjeu démocratique ?

 

4 modalités d’utilisation de la data électorale :

  • L’analyse sémantique pour déterminer les attentes des citoyens sur le Web. Ex :la start-up Proxem a travaillé avec les équipes d’En Marche pour l’élection d’Emmanuel Macron en 2017.

  • La cartographie des comportements électoraux, par CSP, âge, localisation, etc… Une activité qui se rapproche désormais de celle des instituts de sondage. Ex : la start-up Liegey-Muller-Pons a travaillé pour Benoît Hamon et Emmanuel Macron en 2017.

  • La création d’outils de gestion des bases « sympathisants » : « CRM » électoraux, campagnes de fundraising, emailings, webmastering, etc. Ex : l’entreprise américaine NationBuilder a travaillé avec Donald Trump en 2016. En 2017, elle a littéralement explosé en France en travaillant pour Jean-Luc Mélenchon, Emmanuel Macron, François Fillon (mais aussi Alain Juppé, Nathalie Kosciusko-Morizet et Nicolas Sarkozy lors des primaires).

  • L’achat de données massives à des fins de ciblage.

 

Des pare-feux

  • Les données doivent être anonymisées et l’usager doit désormais avoir donné son consentement à la collecte.

  • En France, pas de possibilité d’acheter de l’espace publicitaire en ligne (réseaux sociaux, sites annonceurs, etc) en dehors du cadre prévu pour l’affichage électoral.

 

Cependant :

Des inquiétudes persistent sur le déploiement de campagnes de désinformation sur les réseaux sociaux. Une loi anti Fake News est en cours de discussion au Parlement.

 

 

 

RGPD, ANNÉE 1

 

Le 25 mai dernier, le Règlement Général de Protection des Données est enfin entré en vigueur après des années de débats au sein des instances européennes. Réputé inachevé mais solide dans ses bases, ce texte pose un premier décor législatif autour de la notion de propriété de la donnée personnelle. Et trace un sillon européen entre les visions chinoises et américaines.

Deux mois après les faits, retour sur une adoption en douceur…

Interview

Interview d’Isabelle Fluxa,
Déléguée à la Protection des Données
du Groupe La Poste

« Ce qui amène un changement, c’est la sanction en cas de manquement »

 

Comment ont-ils vécu le passage au RGPD ? L’exemple de La Poste et de Swiss Life

 

1/ Deux mois après les faits, comment avez-vous vécu ce passage au RGPD ?

Cela va vous surprendre mais je n’ai pas eu le sentiment d’un Big Bang car le Groupe était déjà bien préparé : on avait dix ans de cartographie des données personnelles derrière nous donc c’était plus simple de repartir de cette base. Et puis, on a senti un réel enthousiasme autour de cette législation : il n’y avait pas de blocage ou de crainte. Les gens sont très engagés sur le sujet et souvent soucieux sur l’enjeu de la privacy ; du coup c’était plus facile d’évangéliser…

 

2/ Pour vous, le RGPD ne change pas vraiment les choses ?

En France, nous avons la chance que beaucoup de principes énoncés dans le règlement étaient déjà présents dans la Loi Informatique et Libertés. Parmi les nouveautés du RGPD : le droit à la portabilité, le droit à la limitation du traitement…Ce qui amène un réel changement, c’est la sanction en cas de manquement : les entreprises ne vont plus pouvoir se soustraire à leur responsabilité. En cela, il y a une vraie prise de conscience…

 

3/ D’un point de vue opérationnel, comment avez-vous géré cette mise en conformité RGPD ? Y a-t-il des chantiers qui ont été plus difficiles que d’autres ?

Assez classiquement, nous avons procédé à un diagnostic de conformité de nos traitements sur la base des cartographies que nous détenions. Et pour ceux qui n’étaient pas conformes, nous avons défini des plans d’action et des chantiers spécifiques.

Sur les questions de gestion du consentement, je dois dire que le Groupe était déjà bien avancé et que, hormis pour les activités de prospection commerciale, nous n’avons pas d’obligation de recueil général du consentement. Nous avons donc privilégié la communication sur la façon dont nous gérons les données.

En revanche, des chantiers comme la sécurité ou la durée de conservation sont exigeants car ils imposent d’aller vérifier systématiquement que la règle est respectée puis d’automatiser celle-ci. De façon globale, la thématique de la gestion du data lake est au cœur de la démarche : quelles sont les relations avec les SI sources ? A quel endroit doit se faire la gestion ? C’est en résolvant cette question que l’on pourra optimiser la mise en conformité.

 

4/ Comment les collaborateurs de l’entreprise vous perçoivent-ils ?

Certains me voient comme un gendarme de la protection des données personnelles, mais ce n’est pas mon seul rôle ! Mon rôle c’est d’impulser le changement. De façon globale, ce métier me met en interaction avec un grand nombre d’interlocuteurs : les DSI bien sûr avec lesquels j’ai appris à parler le même langage, mais aussi le CDO qui cherche à développer de nouveaux services intégrant la conformité RGPD. Et puis, il y a tous les chefs de projet de l’entreprise que nous devons sensibiliser à l’enjeu de la privacy…

 

5/ C’est donc un gros travail de communication ?

De communication et de formation. A l’automne, nous déclinons des projets de formation par acteur, en adaptant les messages aux différents acteurs.

C’est un véritable changement culturel, et nous avons conscience que nous ne pourrons l’impulser que par des solutions juridiques souples et intégrées dans les problématiques métiers.

Interview

Le témoignage d’Emmanuel Dubois, Directeur de la gouvernance et de la qualité de la donnée,

 

et Cynthia Traoré,
Manager du Département Data Science et Responsable du Data Lab chez Swiss Life

UN PASSAGE EN DOUCEUR

Le RGPD a été l’occasion pour nous de réaffirmer notre politique de protection de la donnée car nous bénéficiions déjà par le passé d’un label CNIL qui témoignait de nos efforts dans ce domaine… le RGPD a donc été un prolongement sans trop d’accrocs et c’était un mouvement nécessaire. Les opérationnels métiers se sont d’ailleurs montrés très vite curieux de la démarche.

 

PRIVACY BY DESIGN

Le principal apport du RGPD, cela a été de remettre en cause nos usages et de repenser la place de la donnée au cœur de ceux-ci. Au sein du Data Lab, nous travaillons maintenant sur des cas d’usage « RGPD compliant ». La première question qu’on se pose en lançant une idée de projet c’est « a-t-on le droit d’utiliser telle ou telle donnée ? »… Forcément, cela remet au centre la problématique de la finalité.

 

NOS ENJEUX

Comme nous traitons beaucoup de données de santé en tant qu’assureur, nous avons un impératif de sécurité que nous devons transmettre à toutes les organisations qui travaillent avec nous. C’est un des chantiers que nous avons engagés : remettre à jour tous nos contrats avec les sous-traitants et instaurer des dispositifs de contrôle. Au-delà, nous prévoyons à la rentrée de poursuivre la feuille de route en matière de durée de conservation de la donnée, de processus d’archivage, de purge et d’évolution des systèmes.

 

LES INDICATEURS DE NOTRE SUCCÈS ?

Difficile d’avoir une vision chiffrée vraiment pertinente sur le taux d’adoption en interne mais nous surveillons des données comme le nombre de collaborateurs formés au RGPD, le nombre de contrats conformes signés par les sous-traitants, et bien évidemment le nombre de clients qui exercent leurs droits.

 

 

 

Ce qu’ils pensent de… L’avalanche de mails reçus le 25 mai :

 

Isabelle Fluxa

Certains ont pu utiliser l’argument du RGPD et de l’appel au consentement pour reprendre contact avec leurs clients. Cela diluait inutilement le message, d’autant que le recueil du consentement n’était pas obligatoire.

 

Emmanuel Dubois

Tous les acteurs ont fait l’effort de communiquer à leurs clients sur le RGPD, plus ou moins simplement : certains ont voulu être complets (quitte à noyer l’utilisateur), d’autres ont fait l’effort de synthétiser les critères de collecte. Ce qui est sûr, c’est que personne n’a pu passer au travers de l’information le 25 mai !

 

 

 

 

BIG DATA FOR GOOD – LA DONNÉE AU SERVICE DU PLUS GRAND NOMBRE

 

Quelques projets qui changent la donn(é)e :

 

METEOSWIFT

Comment produire en continu de l’électricité éolienne quand la force du vent est intermittente ?

Et comment limiter le coût engendré par la compensation d’une phase de vent décroissante ? MeteoSwift (littéralement : METEOrology & Simulation for a WInd Forecasting Tool), c’est la start-up toulousaine qui s’est penchée sur la question en proposant un modèle alliant Big Data et AI directement connecté aux turbines, qui permet aux producteurs d’affiner leurs prédictions météo sur l’afflux de vent à venir. Résultat : ils sont ainsi capables de s’engager sur une quantité d’énergie plus précise auprès de leurs clients et réduisent les coûts engendrés par l’absence de vent (c’est-à-dire les coûts de production d’énergie « back up » qui brûlent des matières fossiles). Meteoswift est piloté par Morgane Barthod, ancienne élève de l’école Polytechnique, et hébergé dans l’incubateur de Météo France à Toulouse. Il a reçu de nombreux prix dont le label« Innovators under 35 » du MIT.

 

TRANSWAY

Comment encourager les citadins à avoir recours aux déplacements propres (vélo, covoiturage, transports en commun, à pieds) sur leurs trajets quotidiens ? Comment aider les collectivités à identifier les besoins en écomobilité de leurs usagers ? Comment développer le trafic des résidents chez les commerçants en ville ? C’est à peu près à toutes ces questions que Transway, la société fondée en 2009 par le nantais Nicolas Tronchon, cherche à répondre avec un concept simple : proposer des applications de suivi des déplacements sur lesquelles les usagers peuvent gagner des points dès qu’ils utilisent un mode de transport propre : par exemple 10 points par trajet en bus ou en tram. Un programme fidélité qui se transforme rapidement en avantage financier puisque des remises sont prévues chez les commerçants partenaires du dispositif. Et pour les collectivités, principales clientes (et donc financeuses) du dispositif, un monitoring précis des flux de passagers qui leur permettra à terme d’optimiser leur mission de service public. Vous avez dit gagnant-gagnant…gagnant ? (Transway est actuellement déployée sur six villes en France et au Canada, dont Toulouse qui réunit 45 000 utilisateurs de ses applications).

 

THE GREEN DATA

Comment optimiser toute la chaîne de production, de transformation, de financement et de distribution de l’agribusiness quand la matière première est fluctuante et les acteurs multiformes ?

Jérémie Wainstain, fondateur de The Green Data en 2015 répond à la question en proposant une plateforme de data analytics en SaaS qui améliore les prédictions liées au produit du champ à l’usine jusqu’au magasin : prévision de récolte, prévision de transports, affectation des lignes de transformation industrielle, modélisation des prix… l’objectif étant d’outiller les différents acteurs du secteur agricole et agro-industriel pour leur permettre une meilleur affectation de leurs ressources et une meilleure collaboration. Une ambition business assumée qui a le mérite de répondre aussi à des enjeux environnementaux.

 

PROJET OPAL

Seul projet public de cette liste, le projet OPAL (pour « Open algorithms ») est un projet financé par l’AFD à hauteur de 1,5 millions d’euros et développé par un consortium de partenaires publics et privés (dont Orange ou le World Economic Forum) en partenariat avec les opérateurs télécom locaux (Sonatel au Sénégal et Telefónica en Colombie). Il vise à collecter les données téléphoniques des habitants de pays en développement pour établir plus rapidement des indicateurs socio-économiques et répondre aux besoins des populations en matière de santé, d’éducation, d’agriculture ou de transport : statistiques de déplacement, statistiques d’usages des mobiles (indices pour détecter les taux d’alphabétisation et de pauvreté régionaux), statistiques sanitaires… Pour exemple, au Sénégal, le projet a permis d’analyser les temps de trajet pour rejoindre les marchés ruraux, ou d’estimer la propagation de maladies contagieuses. En Colombie, ce sont les anciennes zones de conflits avec les FARC qui ont été étudiées pour déterminer les besoins des populations. Un projet qui sera présenté lors du Forum mondial des Nations-Unies sur les données (« UN World Data Forum ») les 23 et 24 octobre prochains à Dubaï.

Interview

Interview dE
Jacques Priol,
CEO de Civiteo

Jacques Priol est un ancien administrateur et directeur de cabinet en collectivités.

En 2016 il a fondé Civitéo et publié « Le Big Data des Territoires ». Rencontre avec celui qui veut replacer la donnée au cœur des décisions publiques et faire sauter le verrou du Big Data en collectivités.

 

 

 

 

« Pendant longtemps, on a cru qu’il suffisait d’ouvrir les données pour que les entreprises s’en emparent »

 

1/ Le Big Data est mûr pour les entreprises mais les collectivités commencent tout juste à se l’approprier… pourquoi ce décalage ?

Il y a en effet un décalage de 2 ou 3 ans entre les collectivités et les entreprises pour des raisons à la fois financières et réglementaires. Financières car les coûts du Big Data ont baissé et sont désormais supportables par des acteurs publics. Réglementaires car l’open data a connu une phase d’accélération notamment grâce à la loi Lemaire qui rend obligatoire l’ouverture des données publiques pour l’ensemble des collectivités de plus de 3500 habitants et 50 agents (elle entrera en vigueur en octobre 2018, ndlr).

 

2/ L’Open Data est donc un des piliers de cette transformation ?

Oui car les données nécessaires aux usages territoriaux (smart city, transports, consommation d’énergie, logements…) sont désormais devenues accessibles, avec d’importants progrès en termes de qualité. Certaines collectivités pionnières (250 au total) n’ont pas attendu la loi Lemaire et ont engagé le mouvement dès le début des années 2010, avec Rennes en tête dès 2010. A l’époque, Etalab était encore embryonnaire. Depuis, des progrès ont été faits en matière d’harmonisation des standards de données et de licences : on est passé de six types de licences à seulement deux.

 

3/ Quelles sont les données concernées ?

En matière d’énergie, on constate des volumes importants depuis qu’Enedis a été soumis à une obligation d’ouverture de ses données. En matière de transport également, de nombreuses sources sont désormais disponibles (capteurs, données de trafic)… même si Google aimerait imposer ses formats de données – mais il est intéressant de constater que certaines collectivités résistent. Et puis il y a encore beaucoup de champs qui sont en pleine expansion : la protection sociale, la santé…

 

4/ Quel est l’intérêt des collectivités à ouvrir leurs données ?

Pour elles, il s’agit de répondre à trois grandes préoccupations. La transparence d’abord, soit la capacité à montrer aux citoyens l’usage qu’elles font de l’argent public. Ensuite, le développement économique pour permettre aux entreprises du territoire d’utiliser les données et de créer de nouveaux services : pendant longtemps, on a cru qu’il suffisait d’ouvrir les données pour que les entreprises s’en emparent… désormais on met l’usage au cœur de la démarche et on favorise le dialogue entre entreprises et collectivités. Enfin, il y a la problématique d’efficacité des services publics en interne : être capable d’utiliser ces technologies en interne pour optimiser les organisations publiques et le service au citoyen.

 

5/ Pourquoi est-il nécessaire d’établir une stratégie de la donnée ?

Parce qu’il y a beaucoup d’acteurs qui captent des données utiles et qui ne les partagent pas, ce qui peut déséquilibrer le service public. Prenez AirBnb : si vous êtes maire d’une commune touristique, vous avez une forte probabilité d’accueillir une recrudescence de touristes l’été et s’ils passent par AirBnb, leurs données de présence vous échappent totalement… ce qui signifie que vous n’êtes pas en mesure de dimensionner le service public en fonction. C’est pour cela que nous accompagnons les collectivités : pour déterminer les données qui seront utiles à leurs services, celles qui doivent être accessibles aux autres, celles qui doivent être complétées par des données externes… Au-delà des outils, c’est vraiment sur la finalité des données que les collectivités réclament notre conseil.