F. L'INFRASTRUCTURE DE CALCUL : INVESTISSEMENT ET MUTUALISATION
Enfin, une infrastructure de calcul spécifique - les processeurs graphiques, ou GPU - est nécessaire pour entraîner les modèles comme pour les utiliser. Or la demande mondiale est aujourd'hui largement supérieure à l'offre, sur laquelle la société américaine Nvidia, avec sa puce H100 à 40 000 dollars l'unité, est en situation de quasi-monopole (80 % de part de marché), même si des concurrents émergent. Pour donner un ordre de grandeur, Meta a récemment annoncé l'acquisition de 350 000 puces H100 pour entraîner son prochain modèle, pour un montant estimé à...9 milliards de dollars (avec une importante réduction, donc).
L'État n'a pas de tels moyens. Bien sûr, celui-ci n'a pas besoin d'entraîner ses propres modèles de base, mais il aura besoin d'une puissance de calcul non négligeable pour le fine-tuning, afin de les adapter à ses usages dans le cadre du service public. L'alternative consiste à faire appel à un prestataire privé, en entraînant les modèles et en les déployant sur un cloud comme celui de Microsoft (Azure) ou d'Amazon (AWS). Renoncer à la maîtrise de l'infrastructure, au profit d'un acteur étranger de surcroît, implique cependant des risques importants (fuites de données, etc.), qui sont évidemment inacceptables pour des applications critiques telles que la gestion du système fiscal et social, ou même la seule détection de la fraude. C'est pourquoi la Commission IA fait de ce sujet l'une de ses priorités :
« Faire de la France et de l'Europe un pôle majeur de la puissance de calcul
La dépendance de l'Europe vis-à-vis des États-Unis, déjà forte dans les datacenters, est encore plus criante pour la puissance de calcul. Il n'est pas nécessaire que tous les modèles utilisés en Europe soient entraînés sur son sol. Cependant, un sursaut est indispensable, à la fois pour entraîner des modèles à usages sensibles, et réaliser une partie de l'inférence. [...]
À très court terme, sécuriser l'approvisionnement de l'écosystème français en puissance de calcul privée. Dès 2024, faire une réservation collective d'une puissance de calcul équivalente à 20 000 H100 auprès de fournisseurs de puissance de calcul, y compris hors du territoire national. Louer cette puissance de calcul à prix coûtant aux acteurs de l'écosystème français, en particulier aux start-ups. Si possible dans des délais courts, réaliser cette opération au niveau européen, en particulier avec l'Allemagne. »
Rapport de la Commission IA, mars 2024, recommandation 14
La DGFiP, qui fait partie des administrations ayant commencé à s'équiper, pourrait ici jouer un rôle important, en mutualisant une partie de ses capacités au sein de la sphère fiscale et sociale. L'intérêt est d'autant plus évident que l'entraînement des modèles n'est pas continu.