Dans beaucoup d’organisations, la promesse de l’IA agentique se résume à déléguer à l’IA les tâches à faible valeur ajoutée, sous supervision humaine. Autrement dit : soulager les employés des tâches rébarbatives, et leur dégager du temps pour diminuer leur charge de travail ou se concentrer sur des tâches à plus haute valeur.
Cette promesse est alléchante, pour les dirigeants comme pour les employés. Elle l’est beaucoup moins quand on regarde ce que la recherche en facteurs humains dit de ce que signifie réellement la « supervision humaine ».
Aujourd’hui, dans un processus métier classique, l’employé est acteur : il saisit des informations, navigue entre systèmes, prend des micro-décisions à chaque étape. Demain, avec des agents IA qui exécutent ces tâches, son rôle bascule vers celui de contrôleur : comprendre ce que l’agent a fait, pourquoi il l’a fait, et valider, ou non, avant que l’information n’atteigne les systèmes cibles.
Ce basculement a l’air d’un allègement de charge. C’est en réalité un changement de métier complet, et il n’est pas sans risque.
Un paradoxe vieux de 40 ans, mais qui n’a jamais été aussi actuel
Ce phénomène n’est pas nouveau : il a été décrit dès 1983 par la chercheuse Lisanne Bainbridge dans un article fondateur, Ironies of Automation, écrit à propos des opérateurs de centrales nucléaires et de salles de contrôle industrielles. Son constat tient en une idée simple mais dérangeante : quand on automatise la majorité d’un processus, l’humain hérite de tout ce qu’on n’a pas pu automatiser, et il cesse, par construction, de pratiquer les compétences nécessaires pour bien faire ce travail là.
Conséquence directe : plutôt que d’avoir besoin de « moins » de formation, l’opérateur a besoin d’en avoir « plus », pour être prêt au moment, rare mais critique, où son intervention va compter. C’est exactement la situation des employés appelés à superviser des agents IA : moins ils interviennent au quotidien, moins ils sont entraînés à détecter l’erreur le jour où elle survient.
Bainbridge ajoutait une seconde idée, tout aussi pertinente pour les agents IA actuels : si un humain doit surveiller les décisions d’une machine, il faut que cette machine raisonne d’une manière et à un rythme que l’humain peut suivre ; sinon, le contrôle humain ne peut s’exercer qu’à un niveau très superficiel, en jugeant si le résultat a l’air « plausible », sans pouvoir vérifier qu’il est « correct ». C’est tout l’enjeu de la traçabilité du raisonnement des agents : sans elle, la « validation » devient un théâtre de contrôle plutôt qu’un contrôle réel.
La charge mentale de la supervision : ce n’est plus une hypothèse
Ce qui change la donne aujourd’hui, c’est qu’on commence à avoir des données précises sur ce que coûte cognitivement la supervision d’agents IA. Une étude du BCG Henderson Institute, publiée en mars 2026 et relayée par la Harvard Business Review, a mesuré ce coût auprès de près de 1 488 salariés à temps plein aux Etats-Unis.
Résultat : les personnes soumises à une forte exigence de supervision d’agents IA dépensaient 14 % d’effort mental supplémentaire, ressentaient 12 % de fatigue mentale en plus et 19 % de surcharge informationnelle en plus, comparées à celles dont l’usage de l’IA demandait moins de contrôle actif. Les chercheurs ont donné un nom à l’état observé chez les profils les plus exposés : l’« AI brain fry », un épuisement cognitif aigu, marqué par des difficultés de concentration, une prise de décision plus lente et une sensation de brouillard mental.
Point important : ce n’est pas du burn-out au sens classique. Le burn-out est une fatigue émotionnelle qui s’installe sur des mois. L’ « AI brain fry » cible spécifiquement l’attention, la mémoire de travail et le contrôle exécutif, les fonctions qu’on mobilise précisément pour suivre le raisonnement d’un agent et vérifier chaque sortie. L’étude observe aussi un seuil : la productivité semble culminer autour de trois flux d’agents supervisés en parallèle ; au-delà, la performance se dégrade nettement. Le cerveau humain a une capacité de supervision simultanée limitée, et la conception des organisations n’en tient quasiment jamais compte.
Le risque le plus insidieux : valider sans vérifier
C’est le troisième risque que beaucoup d’organisations sous-estiment, et c’est aussi le mieux documenté par la recherche : à force de superviser un système globalement fiable, l’humain finit par baisser la garde. On parle d’« automation bias » (ou complacency) : la tendance à trop faire confiance à un résultat qui a l’air plausible, et à sous-investiguer les cas qui devraient pourtant déclencher une alerte. Des décennies de recherche en interaction homme-machine montrent que les humains sont structurellement mauvais pour maintenir une vigilance soutenue face à des systèmes très fiables : paradoxalement, plus le système est bon, plus la vigilance s’érode vite. Dans la pratique, cela se traduit par ce qu’on appelle parfois le « rubber-stamping » (littéralement, tamponner en caoutchouc, comme on apposerait un tampon sans lire ce qu’il y a sur la page) : l’employé clique sur « valider » parce que l’agent a raison la plupart du temps, sans avoir réellement examiné le cas présenté. Le contrôle existe sur le papier, il a disparu dans les faits.
Une étude clinique portant sur 457 médecins illustre bien le mécanisme : confrontés à des outils IA volontairement biaisés, leur précision diagnostique est tombée de 73 % à 61,7 %. Pas parce qu’ils ignoraient la bonne réponse, mais parce qu’ils ont suivi la suggestion de l’IA plutôt que leur propre jugement. La compétence était là, c’est l’acte de validation qui a failli.
Le scandale néerlandais des allocations familiales (un système de scoring automatisé utilisé par l’administration fiscale, documenté par Amnesty International) montre jusqu’où ce glissement peut aller. Le dispositif était présenté comme supervisé par des humains (ce qu’on appelle un système « human in the loop »), où un humain est censé valider chaque décision. Mais dans les faits, faute de temps, d’informations ou de formation suffisants, cette supervision s’était vidée de son sens : les humains étaient présents en théorie, mais sans réelle capacité d’intervention, ce qui revient à un système « human out of the loop » où le système agit en autonomie de fait, même si un humain reste nominalement dans la boucle. Une analyse comparative ultérieure de ce dispositif a conclu que la garantie de supervision humaine y était restée largement théorique. Le contrôle existait sur le papier, pas dans la pratique.
Et la compétence, dans tout ça ?
Il y a un dernier angle, moins souvent évoqué que le rubber-stamping mais tout aussi réel : la perte progressive de compétence chez ceux qui ne pratiquent plus. Une étude sur des endoscopistes utilisant l’IA pour détecter des polypes précancéreux a montré que leur capacité de détection se dégradait dès que l’outil leur était retiré, et ce après seulement trois mois d’usage assisté. Le risque n’est donc pas seulement de valider aveuglément aujourd’hui : c’est aussi de devenir, avec le temps, structurellement moins capable de détecter l’erreur le jour où l’agent se trompe.
Que peut-on faire concrètement ?
Aucune de ces difficultés n’est une fatalité, mais elles demandent une conception explicite du rôle humain plutôt qu’un héritage par défaut :
- Donner de la traçabilité au raisonnement de l’agent, pas seulement à son résultat : pour permettre une vérification réelle, et pas seulement un jugement de plausibilité.
- Suivre le taux de rejet/correction des validations humaines comme indicateur d’alerte : un taux anormalement bas est souvent le signe d’un rubber-stamping généralisé, pas d’une IA parfaite.
- Faire tourner les contrôleurs et limiter le nombre de flux d’agents supervisés en parallèle par une même personne, pour rester sous le seuil de surcharge cognitive.
- Concevoir des interfaces qui forcent un engagement actif (justification écrite, échantillonnage qualité obligatoire) plutôt qu’un simple bouton « valider ».
- Maintenir des créneaux de pratique manuelle régulière, pour préserver la compétence qui permettra de détecter l’anomalie rare.
C’est d’ailleurs l’esprit de l’article 14 de l’AI Act européen sur la « supervision humaine effective » : il ne suffit pas qu’un humain soit présent dans la boucle, il faut qu’il comprenne les capacités et limites du système, et qu’il ait une capacité réelle d’intervention, pas un droit de veto théorique vidé de son sens par la pression du quotidien.
Et ce n’est pas qu’une question de bien-être au travail : c’est aussi, in fine, un risque de productivité. Une supervision qui se dégrade, que ce soit par surcharge cognitive ou par rubber-stamping, laisse passer davantage d’erreurs dans les systèmes cibles : l’étude du BCG citée plus haut observe ainsi jusqu’à 39 % d’erreurs majeures en plus chez les salariés les plus touchés par le « brain fry ». Une automatisation mal contrôlée peut donc finir par coûter plus cher, en corrections et en erreurs propagées, que ce qu’elle était censée faire gagner en efficacité.
Le passage du rôle d’acteur à celui de contrôleur n’est donc pas un simple changement d’outils. C’est un changement de métier qui, mal accompagné, peut produire l’illusion du contrôle plutôt que le contrôle lui-même.
Sources
Lisanne Bainbridge, « Ironies of Automation », Automatica, vol. 19, n° 6, 1983, p. 775-779. sciencedirect.com
Julie Bedard, Matthew Kropp, Megan Hsu, Olivia T. Karaman, Jason Hawes, Gabriella Kellerman (BCG Henderson Institute), « When Using AI Leads to « Brain Fry » », Harvard Business Review, 5 mars 2026. hbr.org — relais bcg.com
« Measuring the Impact of AI in the Diagnosis of Hospitalized Patients: A Randomized Clinical Vignette Survey Study », JAMA Network Open, décembre 2023. pubmed.ncbi.nlm.nih.gov
Amnesty International, Xenophobic Machines: Discrimination through unregulated use of algorithms in the Dutch childcare benefits scandal, 25 octobre 2021. amnesty.org
« Lessons to Be Learned from the Dutch Childcare Allowance Scandal: A Comparative Review of Algorithmic Governance by Tax Administrations in the Netherlands, France and Germany », 2024. researchgate.net
Budzyń K, Romańczyk M, Kitala D, et al., « Endoscopist deskilling risk after exposure to artificial intelligence in colonoscopy: a multicentre, observational study », The Lancet Gastroenterology & Hepatology, vol. 10, n° 12, décembre 2025, p. 1062. thelancet.com
Règlement (UE) 2024/1689 (AI Act), article 14 sur la supervision humaine.

Laisser un commentaire