II. LE DEEP LEARNING : LES NEURONES ARTIFICIELS DE BERCY

Si l'apprentissage automatique est utilisé - à des degrés et pour une efficacité variables -, il n'y a en revanche presque aucun recours à l'apprentissage profond. Pour simplifier, on pourrait dire que l'IA sert à mieux détecter la fraude que l'on connaît, mais pas à identifier celle que l'on ne connaît pas. Ceci renvoie à un paradoxe classique en matière de contrôle fiscal : un contribuable qui déclare peu ou mal a plus de chance d'être « repéré » qu'un contribuable qui ne déclare rien.

Il y a cependant deux exceptions encourageantes, toutes deux à Bercy, et toutes deux dans le domaine de la reconnaissance d'images. Leur intérêt va bien au-delà de leur seul cas d'usage : il s'agit d'apporter « la preuve du concept » (proof of concept, ou POC).

A. BERCY SE JETTE À L'EAU : LE PROJET « FONCIER INNOVANT » DE LA DGFIP

Lancé en 2022 par la DGFiP, le projet « Foncier innovant » s'appuie sur l'IA pour automatiser l'exploitation des images aériennes publiques de l'IGN afin de détecter les constructions ou aménagements non déclarés, avec un test sur les piscines.

Le projet a été piloté par la Délégation à la transformation numérique (DTNum), en lien avec les services du cadastre (bureau et service national), et financé à 50 % par le Fonds pour la transformation de l'action publique (FTAP), pour un coût de 24 millions d'euros.

L'expérimentation menée sur 9 départements pilotes en 2022 a permis de confirmer le caractère taxable de plus de 20 000 nouvelles piscines, représentant près de 10 millions d'euros de recettes supplémentaires pour les communes (taxe foncière). Le dispositif a donc été généralisé en 2023 à l'ensemble de la métropole (la Corse et l'Outre-mer devraient suivre), pour environ 150 000 piscines potentiellement taxables au total, soit une part non négligeable (5 %) des 3 millions de piscines enterrées que compte la France.

Comment ça marche ?

1. À partir des images aériennes publiques de l'IGN, accessibles à tous sur le Géoportail, un algorithme d'apprentissage profond extrait les contours des bâtiments et piscines.

 Deep learning et reconnaissance visuelle : afin d'extraire les objets sémantiques (les contours des bâtiments) des images satellitaires, l'algorithme utilise un réseau de neurones qui, par couches successives, va d'abord affecter une classe à chaque pixel en fonction de sa couleur (bâti/non-bâti/eau, etc.), avant de transformer ces données segmentées (la grille de pixels) en objets vectoriels (les polygones formant les contours de chaque bâtiment).

2. Les données sont comparées avec celles du plan cadastral et d'autres données textuelles détenues par la DGFiP (déclaration préalable aux services d'urbanisme, permis de construire, déclaration d'achèvement, etc.), pour vérifier que ces éléments sont correctement soumis aux impôts locaux.

3. Un agent vérifie systématiquement chaque anomalie potentielle détectée, directement dans l'application métier ICAD.

4. Si l'anomalie est confirmée, le propriétaire est invité à régulariser sa situation sur impots.gouv.fr.

 La sécurité des données : seules les données - publiques - de l'IGN font l'objet d'un traitement sur le cloud de Google, le croisement avec les données fiscales et cadastrales s'effectuant exclusivement sur les infrastructures internes de la DGFiP.

Le succès est donc incontestable, et le projet est d'ores et déjà rentabilisé, les sommes mises en recouvrement couvrant déjà près de deux fois l'investissement initial. Certes, l'enjeu financier est minime en comparaison du rendement total des impôts fonciers, et tout à fait dérisoire au regard des pertes causées par la fraude fiscale, mais l'intérêt de cette expérimentation dépasse son seul cas d'usage. Les principaux acquis sont :

la preuve de l'intérêt de la technologie, qui pourrait être étendue facilement à l'ensemble du foncier bâti et non bâti (garages, abris de jardin, vérandas, etc.), non seulement à la DGFiP mais aussi à la douane (viticulture) ou même hors de la sphère fiscale (agriculture, etc.) ;

l'internalisation des compétences : tout en s'appuyant dans un premier temps sur des prestataires externes (Capgemini et Google), la DGFiP a recruté en interne ses propres spécialistes. La DTNum dispose donc aujourd'hui d'une compétence complète en deep learning (contrairement au pôle datamining) ;

la preuve des vertus de l'agilité dans la conduite du changement, dont les piliers sont : une équipe restreinte aux compétences transversales (y compris venues de l'extérieur), une démarche fondée sur l'expérimentation, la validation des concepts et l'amélioration incrémentale (à la différence des grands projets SI habituels), et enfin une attention portée aux retours du terrain (notamment en ce qui concerne l'ergonomie et la simplicité d'utilisation des outils).

Un outil de fiabilisation du cadastre

Au-delà de l'objectif de lutte contre la fraude, cet outil pourrait permettre d'automatiser des vérifications jusqu'à présent réalisées ponctuellement et manuellement.

Le traitement des images aériennes par l'IA permettrait ainsi une mise à jour des bases foncières et des données cadastrales automatique, systématique, homogène sur tout le territoire et en continu, les photos de l'IGN étant actualisées tous les ans par tiers des départements.

Partager cette page