L'ESSENTIEL

· Le métier des administrations fiscales (DGFiP et douane) et des caisses de sécurité sociale consiste, fondamentalement, à traiter de l'information. Profondément transformées par la révolution numérique des vingt dernières années, elles sont aujourd'hui en première ligne de la révolution de l'intelligence artificielle.

· Avec l'IA, le service public pourrait gagner non seulement en efficacité, mais aussi en humanité. L'IA générative, en particulier, pourrait le rendre plus accessible, plus proche et plus individualisé, et tenir enfin les promesses de la révolution numérique. À condition bien sûr d'en comprendre les risques et les limites.

· Pourtant, l'expérimentation de l'IA générative reste à ce jour balbutiante, et limitée à des cas d'usage généralistes, avec des outils « sur étagère », puissants mais sans dimension métier, ou superficiels, avec des chatbots qui n'apportent qu'une aide limitée, sans transformer les procédures elles-mêmes, et sans accès au « coeur » du système, c'est-à-dire aux dossiers individuels des usagers.

· C'est en matière de lutte contre la fraude que l'intérêt de l'IA est le plus évident. Elle est utilisée depuis une dizaine d'années, avec une différence notable entre Bercy, plus volontariste, et la sphère sociale, sur la défensive. De façon générale, toutefois, les outils employés sont très loin d'être à la pointe de la technologie : le datamining utilise en fait très peu l'IA, et seuls deux projets utilisent le deep learning, pour détecter les piscines non déclarées et les stupéfiants envoyés par courrier postal. Les premiers résultats, éloquents, doivent inciter à aller plus loin.

· Il faut maintenant identifier les cas d'usage, clarifier les objectifs, et s'en donner les moyens : méthodes, compétences, technologies, données et infrastructures.

IMPÔTS, PRESTATIONS SOCIALES ET LUTTE CONTRE LA FRAUDE

Au coeur du service public et de l'État-providence se trouvent, en France comme ailleurs, les administrations chargées de trois grandes missions :

collecter l'impôt pour financer des services d'intérêt général. On entend par impôt l'ensemble des prélèvements obligatoires : droits et taxes, cotisations et contributions sociales, etc. ;

assurer la redistribution, et notamment la redistribution directe, sous la forme de prestations sociales versées aux individus et aux familles (pensions de retraite, prise en charge des dépenses de santé, allocations familiales, aides au logement, indemnisation du chômage, minima sociaux tels que le RSA et le minimum vieillesse, etc.) et d'autres transferts directs (crédits d'impôt, etc.) ;

lutter contre la fraude fiscale et sociale sous toutes ses formes, mais aussi contre son pendant qu'est le non-recours aux prestations sociales, dans un double objectif de justice et d'efficacité.

En France, cinq « administrations » sont principalement chargées de ces missions et font l'objet de ce premier rapport thématique :

2 grandes directions à réseau de la sphère fiscale : la direction générale des finances publiques (DGFiP) et la direction générale des douanes et droits indirects (DGDDI) ;

3 caisses de sécurité sociale : la caisse nationale d'assurance vieillesse (Cnav), la caisse nationale d'allocations familiales (Cnaf) et l'Union de recouvrement des cotisations de sécurité sociale (Urssaf).

À noter

· Ces cinq administrations ont d'autres missions : gestion publique (comptes de l'État, domaine, gestion financière et comptable des collectivités locales, etc.), élaboration des textes législatifs et réglementaires, commerce international, soutien aux entreprises, etc.

· Ces trois missions concernent d'autres administrations : organismes de sécurité sociale, opérateurs de l'État, certaines collectivités, etc.

· L'IA soulève les mêmes enjeux dans d'autres services publics dont le « métier » consiste à traiter de l'information, notamment dans le périmètre des ministères économiques et financiers (Trésor, Budget, autorités de régulation, etc.) et des ministères sociaux (services centraux, organismes de sécurité sociale, etc.), dans les corps d'inspection (IGF, Igas) et la statistique publique (Insee, Drees).

Ces cinq administrations partagent un point commun : leur « métier » consiste essentiellement à traiter de l'information, par nature abstraite et immatérielle. C'est une spécificité forte qui les distingue de la plupart des autres principaux services publics, dont la dimension matérielle et concrète est irréductible : l'enseignant est face à ses élèves, le soignant auprès des malades, le policier sur la voie publique. Seule la douane, dont certaines missions ont par nature une composante matérielle (le contrôle des flux de marchandises et de voyageurs), fait en partie exception.

Cette particularité explique que les administrations de la sphère fiscale et sociale aient été si tôt et si profondément transformées par la « révolution numérique » : à elle seule, la DGFiP a perdu 30 000 emplois en quinze ans, soit 25 % de ses effectifs, notamment dans les services en charge de l'assiette (calcul de l'impôt), du recouvrement et du contrôle, et réduit le nombre de ses implantations territoriales. Cette mutation ne s'est pas faite sans difficulté, et elle s'est parfois accompagnée d'un sentiment de déshumanisation ou de recul du service public, chez les agents comme chez les usagers. Et pourtant, sa cause est profonde - car dans le même temps, l'administration fiscale passait au numérique : déclaration en ligne sur impots.gouv.fr, puis déclaration pré-remplie et prélèvement à la source, dématérialisation des paiements, datamining, facturation électronique, etc. Le service public a gagné en efficacité, et souvent en qualité - pas toujours, pas partout, mais suffisamment pour que personne, aujourd'hui, n'envisage un retour au papier.

Aujourd'hui, la même spécificité place ces administrations en première ligne de la révolution de l'intelligence artificielle (IA). Mais les enjeux sont différents, et plaident pour un optimisme raisonnable. Pour mesurer toute la portée de cette technologie et en comprendre les bénéfices potentiels comme les limites, encore faut-il préciser ce que « traiter de l'information » veut dire.

L'information, ce sont d'abord des chiffres (revenu, taux, etc.), et plus généralement des données structurées et standardisées (nom, adresse, numéro de sécurité sociale, numéro TVA/SIRET, organisme de rattachement, éligibilité à un dispositif, etc.) exploitables par un système d'information (SI).

Ici, l'IA n'est pas nécessaire : pour le « coeur » de leurs missions, les administrations s'appuient sur des systèmes informatiques « classiques », basés sur des règles logiques, afin de calculer l'impôt ou les prestations sociales. Si elle n'est pas nécessaire, l'IA peut néanmoins s'avérer utile, voire très utile, pour automatiser certaines tâches et analyser des données, pour offrir un service public de meilleure qualité, et bien sûr pour mieux détecter la fraude. Comme on le verra, toutes les « IA » ne se valent pas : si l'apprentissage automatique « simple » (machine learning) offre déjà beaucoup de possibilités, c'est l'apprentissage profond (deep learning) qui est, de loin, le plus performant pour identifier des corrélations qui auraient échappé à un humain.

Mais l'information, ce sont aussi des textes, des mots, des écrits de tous types : corpus normatif (lois, règlements, jurisprudence, doctrine, etc.), échanges de mails et de courriers avec les usagers ou en interne, contrats, pièces justificatives, comptes rendus de réunion, instructions et autres notes de service. Autant de données textuelles et autres données non structurées qui constituent en réalité la matière de base du travail quotidien des agents, très loin devant les chiffres et les calculs, depuis longtemps délégués à la machine. Et pourtant, cela ne fait pas si longtemps que ces documents écrits sont identifiés comme des « données », au sens d'un actif immatériel valorisable et exploitable grâce à l'informatique.

À cet égard, l'IA générative a radicalement changé la donne : les performances spectaculaires des grands modèles de langage en matière de compréhension, d'analyse et de production en langue naturelle permettent désormais de donner du sens à tout ce corpus, avec une efficacité et pour des usages inimaginables il y a quelques mois.

En bref

· Le machine learning et le deep learning sont adaptés pour traiter des données structurées et normalisées, notamment les chiffres.

· L'IA générative et les large language models excellent dans le traitement du langage naturel et des données non structurées et hétérogènes, notamment les textes.

Afin de bien saisir la singularité de cette innovation, le présent rapport abordera successivement :

I. L'expérimentation de l'IA générative par les administrations fiscales et sociales, pour l'ensemble de leurs missions ;

II. L'utilisation de l'IA dans la lutte contre la fraude (toutes techniques confondues), c'est-à-dire là où ses avantages sont les plus évidents et potentiellement les plus immédiats.

*

Pour le service public, tout ceci n'est pas seulement un enjeu d'efficacité : c'est aussi un enjeu d'équité, d'accessibilité, et donc d'humanité. L'IA, et particulièrement l'IA générative, permet de simplifier, de personnaliser, d'expliquer et de rapprocher le service public. En un mot, elle pourrait être l'occasion de tenir, enfin, les promesses de la révolution numérique.

Cela vaut pour le service public en général, et pour les administrations fiscales et sociales en particulier. Celles-ci ont un autre avantage : l'utilisation de l'IA dans le cadre de leurs « métiers » n'implique pas le recours à des outils particulièrement sophistiqués ou proches de la « frontière technologique ». Il s'agit pour l'essentiel d'applications relativement simples - bien plus, en tout cas, que les modèles de deep learning auxquels le terme d'« IA » fait aujourd'hui référence en matière de recherche médicale, par exemple.

Enfin, et sans pour autant sous-estimer les risques et enjeux propres à la lutte contre la fraude, les cas d'usage sont généralement moins « sensibles » qu'ailleurs, par exemple en matière de défense (drones autonomes), de sécurité (reconnaissance faciale) ou encore de justice (prédictive).

Pourtant, dans les faits, l'IA est finalement très peu utilisée à Bercy, et elle l'est encore moins dans la sphère sociale : l'expérimentation de l'IA générative est balbutiante et limitée à des outils généralistes ou à des cas d'usage superficiels, et la lutte contre la fraude est très loin de bénéficier des technologies les plus récentes.

Bien sûr, au sens large, il est facile de voir de l'IA partout, et depuis longtemps, car il n'existe pas de frontière nette entre ce qui est de l'IA, et ce qui n'en est pas. Dans sa communication publique sur le sujet, l'administration joue parfois sur ce flou pour « recycler », sous un vocable nouveau et à la mode, des projets qui en réalité ne reposent que peu, voire pas du tout, sur l'IA au sens actuel. L'un des objectifs de ce rapport est précisément de « faire le tri », ce qui implique d'entrer dans le détail de la technologie.

Plus fondamentalement, toutefois, on ne peut ignorer les raisons de ce « retard » - un retard qu'il faut aussi relativiser, du moins si l'on compare la situation à celle d'autres pays, ou d'autres administrations.

Il y a, d'abord, les craintes et les incompréhensions que suscite une technologie à la fois très récente, impressionnante et encore mal comprise. Ces craintes sont légitimes, et sont avant tout le signe qu'un immense effort de pédagogie, de sensibilisation et de démystification reste à accomplir, à tous les niveaux. Car cette technologie, pour reprendre les termes du rapport de la Commission de l'intelligence artificielle, « ne doit susciter ni excès de pessimisme, ni excès d'optimisme », et « l'Europe et la France ont des atouts pour être acteurs de cette révolution ».

Il y a, ensuite, le rappel à la réalité : les administrations fiscales et sociales sont les piliers de l'État-providence, elles sont en situation de « monopole légal » sur leurs missions, et même avec la plus grande volonté du monde, on ne peut pas ignorer leur histoire, leur organisation, leurs systèmes d'information, et bien sûr les agents qui y travaillent.

Il y a, enfin - et surtout - les risques pour les libertés individuelles et les droits fondamentaux. Ces risques sont réels, et il ne s'agit pas de les sous-estimer, mais bien plutôt de les souligner, pour mieux les anticiper.

La bonne nouvelle, c'est qu'il existe un cadre - législatif, constitutionnel, européen -, dont les principes sont solides, et dont il faut veiller à garantir l'application effective. Rien de tout cela ne se fera sans les acteurs concernés : la Cnil, le Parlement, les citoyens.

Partager cette page