Dans la peau d’un agent Immobilier

Découvrez comment j'ai relevé le défi d'estimer un bien immobilier à Serris en utilisant la régression linéaire, une technique d'intelligence artificielle. À travers cette étude de cas, j'explore le processus, de la collecte et du nettoyage des données jusqu'à la comparaison avec le marché actuel. Plongez avec moi dans cette aventure analytique et voyez comment l'IA peut transformer l'évaluation immobilière.

Mais comment un agent immobilier estime un bien ?

Je me suis toujours demandé comment les agents immobiliers parvenaient à évaluer avec précision le prix d’un bien. Les fluctuations du marché, les caractéristiques uniques de chaque propriété, la localisation… Comment assembler toutes ces pièces du puzzle ?

Ici ou là, je lis « Faire appel à un expert est le meilleur moyen d’obtenir une estimation objective de votre bien immobilier. L’agent immobilier connaît le marché« .
Seulement, voilà, je n’ai rien contre les experts du marché de l’immobilier, mais ceux qui me connaissent savent que je ne peux me contenter d’un conseil aussi « objectif » soit-il sans me faire ma propre idée.

C’est pourquoi, aujourd’hui, je me lance le défi d’essayer d’évaluer le prix d’un bien à l’aide d’un outil statistique couramment utilisé en IA: la régression linéaire.
Évidement, pour cela il me faudra des données.

Où trouver les données ?

Après une courte recherche sur internet, je trouve des données officielles qui contiennent les transactions immobilière en France disponibles sur data.gouv.fr.

Plusieurs années sont disponibles, je n’utiliserai que le dernier disponible (1er semestre 2023) qui me suffira pour avoir des estimations proches du marché actuel.

Vous vous en doutez le fichier est rempli de chiffres, de dates et de descripteurs. Ces données brutes, représentant les transactions immobilières récentes, sont une mine d’or. Avant même de penser à l’analyse, un nettoyage s’impose. Je filtre les données pour ne garder que celles que je vais utiliser pour mon analyse. J’élimine les entrées incomplètes, corrige quelques anomalies ou valeurs aberrantes et me concentre sur les variables qui, je le suppose, influencent le plus la valeur foncière : la surface réelle bâtie, le nombre de pièces principales, et la surface du terrain, le code postal de la ville, le type de logement.

Extrait du fichier contenant les données
Ici un extrait du fichier de data.gouv.fr après nettoyage.

A quoi ressemble une régression linéaire ?

Avec mes données prêtes, je me lance dans la construction d’un modèle de régression linéaire. L’objectif ? Prédire la valeur foncière des appartements.

Afin de faciliter la compréhension, je vais filtrer sur une ville pour mon étude de cas: Serris.

Bien que mon modèle utilise plusieurs paramètres dans le graphique je n’afficherai que la valeur foncière par rapport à la surface des appartements. J’ai donc retirer les maisons et autres type de biens.

Voici un l’extrait du code qui contient l’entraînement du modèle :

# Division des données en ensembles d'entraînement et de test
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Utilisation d'un modèle de régression linéaire
model = LinearRegression()

# Entrainement
model.fit(X_train, y_train)

Par la suite le modèle, d’IA positionne une « ligne » puis la compare avec les données existantes en 2023, il repositionne la ligne petit à petit cette ligne afin de réduire son erreur de prédiction. c’est ce que l’on nomme la phase d’apprentissage dans une régression linéaire.

Une fois le modèle entraîné, l’heure est venue de le mettre à l’épreuve !

Je génère un graphique, le cœur légèrement battant. Les points s’éparpillent sur l’écran, représentant les données réelles, tandis qu’une ligne rouge trace ce que mon modèle prédit. La concordance n’est pas parfaite — et comment pourrait-elle l’être ? Mais les tendances sont là, visibles et compréhensibles. C’est un moment de révélation : l’abstraction mathématique prend vie sous mes yeux.

La régression linéaire sur les appartements de Serris en 2023

Si dans le graphique suivant la ligne n’est pas une droite, c’est qu’il existe plusieurs paramètres dans mon analyse comme, par exemple, le nombre de pièces de l’appartement.

Le Test Ultime : Comparaison avec le marché

Armé de mon modèle, je décide de confronter ses prédictions à la réalité du terrain. Je sélectionne deux ou trois annonces immobilières récentes dans la ville de Serris.

1er test avec cette annonce :

Comment un agent peut évaluer cet appartement neuf en vente 2pièces pour 51m².

289 000 € (5684€ le m²)

Appartement neuf 2 pièces – 51m² – rdc

Serris 77700

date: 31/03/2024

Valeur foncière prédite par mon modèle pour un appartement de 2 pièces avec 51m² à Serris : 276 346
(note au futurs acquéreurs: d’après mon modèle, il serait intéressant de négocier le prix annoncé dans l’annonce 🙂 )
Bien que différente, la prédiction est relativement proche de la proposition.

2e test avec cette autre annonce :

Comment un agent peut évaluer cet appartement neuf en vente 4pièces.

399 000 € (4748€ le m²)

Appartement neuf – 4 pièces – 84m² -1 étage

Serris 77700

date: 31/03/2024

Valeur foncière prédite par mon modèle pour un appartement de 4 pièces avec 84m² à Serris : 414 494
Ici aussi le modèle reste relativement proche de la proposition.

Pour chacune, j’applique mon modèle pour estimer la valeur foncière en me basant uniquement sur les informations fournies dans l’annonce. Le moment de vérité est étonnamment satisfaisant.

Bien que mes estimations ne soient pas parfaites (elles ne le pourraient pas), elles s’approchent de façon remarquable aux prix demandés sur le terrain !

Mission accomplie !

Voilà j’espère que cela vous a plu, n’hésitez pas à poser vos questions, je peux vous transmettre le bout de code python sur simple demande.

Ici, j’ai utilisé une régression linéaire, mais un autre modèle basé sur un réseau de neurones aurait été possible.

L’avantage ici est que le modèle est plus simple et les résultats explicables.


Partagez votre amour

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *