retour au sommaire

Thomas

Lefebvre

Directeur scientifique

 

MeilleursAgents.com

Big data allié ou ennemi de l’agent immobilier ?

En quoi le Big Data a-t-il impacté le secteur de l’immobilier et Meilleurs-Agents.com ?

 

La culture de la donnée aux États-Unis est beaucoup plus développée qu’en France. L’ensemble des transactions immobilières y sont accessibles et disponibles depuis plus de 30 ans. En France, l’ouverture des données immobilières est très récente.

 

MeilleursAgents a été créé, en 2008, par Sébastien de Lafond, Pascal Boulenger, Jordan Sanial et Julien Cheyssial, qui ont fait le constat que le marché de l’immobilier était un marché opaque où les transactions immobilières reposaient sur un ensemble de connaissances et d’échanges essentiellement informels non structurés et peu quantifiés. La masse des données sur l’immobilier augmente alors de manière exponentielle du fait de la migration progressive des données de l’ensemble de la profession vers le net. Cela a entraîné un véritable foisonnement de la donnée immobilière. Le lancement de Google Maps en février 2005 a également été un déclencheur pour le lancement de l’activité de MeilleursAgents, basé sur la cartographie des prix de l’immobilier.

 

MeilleursAgents a donc été créé avec pour objectif de fournir des informations pour aider les particuliers à prendre des décisions immobilières basées sur les éléments les plus rationnels et les plus objectifs possibles, par exemple être capable d’objectiver le prix au m2 dans tel quartier de Paris.

 

 

Meilleurs-Agents.com n’est pas un acteur traditionnel de l’immobilier : quel en est le modèle ?

 

MeilleursAgents est une plateforme d’intermédiation dont le business est de mettre en relation des particuliers, qui viennent pour rechercher des informations sur le marché, le prix, et des agences. C’est ce flux de porteurs de projets immobiliers, acheteurs et vendeurs, que nous mettons en relation avec des agences immobilières qui payent un abonnement pour être affichées sur notre site web. Aujourd’hui, plus de 7000 agences sont visibles sur le site de MeilleursAgents, ce qui représente plus d’¼ des agences du territoire français.

 

Nous proposons aux agences d’être visibles sur l’ensemble de notre site et de valoriser leur savoir-faire au travers de e-vitrines auprès de particuliers ayant un projet immobilier. Nos offres de visibilité sont de véritables outils marketing permettant aux agents immobiliers d’obtenir des mandats de vente. La question première que va se poser un particulier quand il va vouloir vendre son bien c’est d’en connaître la valeur. Nous répondons à cette question grâce à notre data et à nos outils d’estimations. Nous sourcons donc des prospects vendeurs avant tout le monde et les redirigeons vers les agences partenaires. En France nous voyons 50% des vendeurs en avant-première. En Ile-de-France et sur Paris, cela représente plus de 80% des vendeurs.

 

La data est donc véritablement le socle de l’entreprise, c’est grâce à la data qu’il y a un flux de visiteurs transformés et envoyés vers les agences.

 

 

Quelles sont les données récoltées ?

Parle-t-on véritablement de Big Data dans l’immobilier ?

 

Pour répondre à la question de la valeur d’un bien, il faut mettre à disposition des outils pour permettre d’obtenir un prix hyper fiable et précis. Ce n’est pas un exercice simple car le volume de données immobilières est limité, il s’agit d’un univers fini. On recense environ 800 000 transactions par an dans l’immobilier ancien, ce qui ne peut pas forcément être qualifié de Big Data. Certains acteurs, du e-commerce par exemple, peuvent récolter les données de millions de transactions et des millions de flux de visiteurs par seconde. Dans l’immobilier, on parle plus de Smart Data, parce que l’actif immobilier et les données qui en découlent sont très hétérogènes. Il n’y a pas deux biens immobiliers qui se ressemblent.

 

1 La base BIEN en île de France est une de nos premières sources de données. Elle recense l’ensemble des transactions immobilières enregistrées par les notaires. Le site Immo Notaires permet à un usager d’accéder, après rétribution, à ces informations détaillées de vente de biens immobiliers. A la différence de MeilleursAgents, le site des notaires fournit uniquement des informations sur les transactions réalisées. Un particulier qui a un appartement de 100m2, situé au 4ème étage, va pouvoir obtenir de cette application des informations sur la dernière transaction réalisée dans l’immeuble, par exemple un 30m2 situé au rez-de-chaussée et vendu il y a deux ans. Mais comment utiliser cette information pour estimer le prix de mon bien, deux ans plus tard, alors que mon bien n’a rien à voir avec celui déjà vendu ?

 

Notre valeur ajoutée est d’exploiter ce flux de données et de casser cette hétérogénéité structurelle, due au marché, et la rareté des informations sur les transactions (800 000 transactions sur 30 Millions d’unités d’habitations). On estime le stock de biens à vendre par le flux. Mettre un prix sur un appartement qui n’a pas été vendu, parfois depuis plus de 30 ans, est très complexe. Il faut donc faire parler les données mises à disposition. Au sein d’un même immeuble par exemple, les prix peuvent varier du simple au double entre les étages.

 

Communiqué réalisé par MeilleursAgents sur l’impact des ascenseurs et des étages sur les prix

 

 

À Paris par exemple, MeilleursAgents cherche donc à mettre un prix sur chaque immeuble parisien. La complexité vient de l’hétérogénéité des biens d’un immeuble à l’autre, vous pouvez passer d’un immeuble haussmannien à un immeuble années 70, donc les prestations et les prix sont différents. Il faut réussir à modéliser cette réalité de marché. Par exemple, le 138 rue du Faubourg Saint Martin est situé proche de la Gare de l’Est et subit par conséquent les mêmes nuisances que les autres immeubles avoisinants et pourtant on distingue trois immeubles sur la carte derrière la façade du 138, qui bénéficient d’une meilleure vue et de moins de nuisances que les immeubles avoisinants et de meilleures prestations.

 

 

 

 

L’objet de la data, c’est donc de pouvoir offrir cette granularité de prix et une estimation la plus fiable possible. Un prix est estimé sur chaque immeuble sur l’ensemble de l’île de France et dans les 20 plus grandes villes de France. Pour les autres villes, les estimations sont faites à l’échelle d’un quartier ou d’une commune. Le modèle de MeilleursAgents dépend véritablement du contexte informationnel et des données dont ils disposent dans chaque ville.

 

2 Nous utilisons les données des transactions, remontées par les agences partenaires du site, soit 7000 agences sur la plateforme qui remontent les biens vendus. C’est un système particulièrement vertueux car les agences se créent des e-vitrines sur notre site. Elles sont visibles dans l’annuaire, on peut consulter leurs annonces, les avis clients et la liste des biens vendus. Leur but est de montrer qu’elles sont actives sur leur secteur, de rassurer le consommateur et de montrer qu’elles sont pertinentes pour vendre un bien. Elles ont donc tout intérêt à remonter leurs biens vendus.

 

3 Les annonces remontées par les agences sont également utilisées, il ne s’agit pas dans ce cas d’une donnée de transaction mais d’un premier signal, analysé pour en déduire un prix de transaction. Les annonces permettent d’estimer le prix des biens. Par exemple, sur un marché hyper dynamique, le délai de commercialisation sera court et la décote faible. Sur un marché baissier en revanche, comme de 2012 à 2014, la décote est plus importante et le marché moins dynamique. Le modèle permet d’anticiper l’augmentation d’un bien à partir de l’observation du marché et donc d’estimer le prix mais également le délai de commercialisation.

Les annonces publiées sur notre site le sont sans adresse naturellement en raison de la concurrence entre les agences. Nous avons donc développé des modèles de géolocalisation comme pourrait le faire un humain. Le modèle va lire une annonce, et grâce à un référentiel géographique va être capable de lire les différents mots clefs, les différents points géographiques et va trianguler la localisation de l’annonce sur la carte.

 

4 Enfin nous utilisons les données publiques de l’INSEE, par exemple sur le revenu, le chômage, l’âge des habitants. La relation entre le revenu et le prix de l’immobilier est très pertinente. Ces données seront utilisées aussi pour combler le manque d’informations. Les données de l’INSEE ont également été utilisées pour modéliser le marché de la location grâce à des algorithmes de diffusion. Nous avons constaté, en utilisant 15 critères sur la base de données de l’INSEE, qu’il y avait des villes similaires au sens des critères sociodémographiques des habitants : mêmes âges, mêmes revenus, même taux d’employabilité et de chômage. Nous avons donc utilisé des algorithmes de Machine Learning pour clusteriser les villes et appliquer les données de loyers à des villes sur lesquelles nous n’avions pas d’informations. Des algorithmes de diffusion et de clustering de villes combinés ont permis de couvrir environ 90% du territoire français. Il s’agit là de techniques assimilées Big Data.

 

Cela représente un certain volume de données hétérogènes sur lequel nous utilisons des techniques Big Data et de Machine Learning. Dès le départ MeilleursAgents a fait le pari de la recherche et a énormément investi en R&D. Nos modèles sont issus de nos propres travaux de R&D plutôt que d’utiliser des briques existantes.

 

 

Une culture de la recherche à l’origine de l’innovation

 

Je suis arrivé dans l’entreprise il y a 7 ans en tant que doctorant et analyste immobilier. Depuis la soutenance de ma thèse, j’occupe le poste de Directeur Scientifique et pilote l’ensemble des activités de R&D de MeilleursAgents. J’embauche de jeunes doctorants ou travaille avec des chercheurs pour nous permettre de continuer à être moteur en R&D dans le secteur de l’immobilier en France. Il y a une vraie complémentarité avec l’équipe data qui va travailler sur les flux de données, leur qualité mais surtout sur les outils permettant de tester nos modèles ainsi que leur industrialisation. Notre équipe scientifique travaille, elle, sur les modèles mathématiques et économiques permettant de comprendre et appréhender le marché immobilier. Les équipes travaillent naturellement ensemble pour créer des cartes, des indices et l’ensemble des outils innovants de MeilleursAgents.

En face des données, la partie scientifique et recherche est primordiale. Nous avons noué plusieurs partenariats de recherche avec l’université Paris Dauphine, le laboratoire d’économie de Cergy Pontoise, la Toulouse School of Economics, ou encore le CNRS. Et nous faisons appel aux thèses CIFRE, ce sont des dispositifs mis en place par l’Etat pour promouvoir l’embauche de doctorants dans les entreprises.

 

On constate de plus en plus, avec l’avènement du Big Data notamment, de conventions industrielles de formation financées par la recherche d’entreprise. Il s’agit de partenariats entre l’entreprise, le laboratoire de recherche et le doctorant, pour travailler sur un sujet de recherche qui pourra être appliqué de manière opérationnelle et business. C’est également économique pour les entreprises qui embauchent les doctorants car elles touchent 15 000 euros par an, plus des réductions d’impôts pour la recherche. Cela permet d’avoir des salariés spécialisés (Bac + 8) en lien avec les laboratoires, véritable vivier d’innovation pour les entreprises. Pour les laboratoires cela permet également d’avoir des liens avec les entreprises pour récupérer des données et créer des sujets de recherche.

 

 

Quels sont les fondements de vos modèles algorithmiques ?

 

Il s’agit de modèles mathématiques et économétriques issus de la littérature sur la finance et l’économie du logement :

 

- Le modèle ou l’approche hédonique qui consiste à décomposer le prix d’un bien en valorisant ses caractéristiques (étage, nombre de salles de bains, qualité de l’environnement urbain, terrasse…)

 

- Le modèle des ventes répétées qui prend pour base, sur un intervalle plus ou moins long, l’ensemble des biens ayant fait l’objet d’au moins deux ventes. On mesure alors pour chacune des paires ainsi répertoriées, le taux de croissance du prix entre le moment de la première vente et celui de la deuxième. Une méthode statistique adaptée permet d’agréger l’ensemble des taux observés et d’en déduire un indice d’évolution des prix.

 

- Le modèle de statistiques spatiales : la géostatistique est appliquée aux données immobilières pour déterminer une estimation non biaisée du prix, donner une meilleure prédiction et déterminer les segmentations du marché immobilier. L’économétrie spatiale est utilisée pour déterminer le degré de corrélation spatiale, estimer les indices ou pour évaluer la variation de prix liée à une externalité.

 

En agriculture par exemple des chercheurs travaillent avec des prélèvements qui permettent de déterminer la fertilité du sol en certains points, les statistiques spatiales permettent de prédire la fertilité de l’ensemble du terrain. C’est la même chose avec les données immobilières, à partir de transactions en certains points, nous déterminons l’influence sur un bien pour estimer un autre bien de manière intelligente. Le modèle doit être capable d’appréhender les vecteurs de diffusion s’appliquant à un bien. Par exemple, un bien situé à Nice sur la promenade des anglais avec vue mer ou avec vue sur cour, et donc sur la gare, n’a pas la même valeur. Le modèle doit être capable d’appréhender ces différentes caractéristiques.

 

Aujourd’hui, une vingtaine de caractéristiques suffit, parmi lesquelles la présence d’un ascenseur, l’étage, la surface, le nombre de pièces, la présence d’un balcon, les DPE etc… En revanche, nous pouvons encore avoir une marge de progression sur l’évaluation de l’état du bien qui est subjectif et déclaré par le particulier. Les 20 critères objectifs sont observés dans les bases de données. Ces caractéristiques sont estimées pour faire varier les critères de scoring. On sait par exemple que l’impact du rez-de-chaussée est estimé à 30% de décote. Nos modèles de scoring sont également recalibrés tous les ans.

 

Les données de la Smart City pourraient à termes également être incluses dans nos modèles, cela fait partie des vecteurs de diffusion. Par exemple les données de pollution ne sont pas encore prises en compte, il y a pourtant une décote naturelle si vous habitez en étage peu élevé sur la rue la Fayette à Paris.

 

 

Quel est l’impact, selon vous, de la data sur les métiers de l’immobilier ?
Les agents immobiliers sont-ils voués à disparaître ?

 

Depuis le départ, les agents immobiliers sont au cœur de notre modèle. MeilleursAgents n’envisage pas la suppression des agents. Aux vues des montants engagés et le fait qu’un particulier n’achète qu’un ou deux biens dans sa vie, il y a un vrai besoin de conseil et une recherche de réassurance dans l’estimation et la négociation du bien.

 

La data ne va pas, selon nous, uberiser le marché. Elle doit au contraire permettre aux agents de se concentrer sur leur cœur de métier, sur la réassurance, la fixation et la négociation du prix et l’accompagnement pendant la transaction. La data donne une indication du prix mais l’agent immobilier est indispensable pour plus de précision dans l’estimation.

 

Il doit s’aider de la data pour augmenter ses performances et la recherche de mandats. Si aujourd’hui plus de 90% des français débutent un projet immobilier sur internet et si 1 vendeur sur 2 réalise une estimation sur MeilleursAgents, ils sont toujours une majorité à conclure avec un agent immobilier.

 

Le vendeur est donc mieux informé sur les prix mais aussi sur les agences, particulièrement celles visibles sur des logiques de recherches géolocalisées et qui jouent le jeu des avis clients. C’est important pour les agents immobiliers de bien appréhender cette complémentarité fondamentale.

 

 

Quels sont les prochains défis du Big Data pour les acteurs de l’immobilier ?
Va-t-on vers du
prédictif dans les estimations immobilières ?

 

Il n’y a pas encore de prédictif dans l’immobilier. En revanche, nous avons construit l’ITI, un indicateur de tension immobilière qui va permettre de comprendre et d’anticiper les évolutions du marché. Nous retraitons les visites, sur notre site web, des personnes qui font des demandes d’estimations, à peu près 150 000 par mois. Quand ils font une demande d’estimation, ils se déclarent comme acheteur, vendeur ou simple particulier qui souhaite une estimation de la valeur de son bien. En retraitant ce flux, on peut par exemple dire que sur cette zone on recense 4 acheteurs pour un bien en vente. En suivant ces informations dans le temps ainsi que l’évolution des taux par exemple en France, nous sommes capables d’anticiper les évolutions du marché. Le marché parisien entre 2009 et 2011 a par exemple subi une hausse de 40% et s’est ensuite retourné en juin 2011 : nous aurions été capables d’anticiper ce retournement avec cet indicateur.

 

Le marché de l’immobilier n’est pas forcément le plus avancé en matière de data et d’analyse, cela vient de la culture française car historiquement l’immobilier est un actif sans risque qui n’a pas forcément besoin d’être optimisé. La mentalité a changé mais c’est également la technologie qui a donné un coup de pouce (Google Technologies, Google Maps etc…) et le consommateur qui est de plus en plus en demande.

 

Les futurs enjeux résident dans l’ouverture des données, la compréhension du marché mais également la transparence. L’accessibilité de l’information pour les particuliers est une vraie nécessité, le marketing est un vrai challenge pour les professionnels.

Thomas Lefebvre est titulaire d’un Master en mathématiques appliquées obtenu à l‘Université de Besançon. Il a ensuite obtenu un Doctorat à l’Université Paris Dauphine en conciliant ses études et un emploi chez MeilleursAgents.com. Recruté comme Analyste immobilier doctorant, il est devenu en 2015 responsable de la R&D, puis Directeur scientifique de MeilleursAgents.com après la soutenance de sa thèse sur l’économie de l’immobilier.

 

Très attentif aux liens qui unissent le monde de l’entreprise et celui de la recherche, Thomas est aujourd’hui Chercheur associé à Paris-Dauphine. Il enseigne parallèlement la finance et l’économie de l’immobilier aux étudiants en Master de cette même Université.