Tout savoir sur les agents IA

Les agents, travailleurs de l’ombre

Votre réveil sonne à 6h53, le moment propice choisi par votre agent IA santé car votre montre connectée indique une fin de sommeil paradoxal et votre agent IA calendrier prévoit 30 min de déjeuner et 30 min de préparation avant votre call de 8h. Votre agent de trading vous annonce que les opérations sur les bourses asiatiques ont enrichi votre portefeuille de 300 euros dans la nuit. Les gains sont aussitôt versés sur le livret ouvert récemment par votre agent finances personnelles pour les études supérieures de vos enfants.

Pas une minute à perdre, tout en beurrant vos tartines vous lancez 10 agents en parallèle qui explorent les tracés des 50 km de pistes cyclables dont vous avez la charge sur la métropole lyonnaise, pointant toutes les parcelles à racheter et les coordonnées de leurs propriétaires afin de lancer les premiers courriers. L’agent travaux vous donne l’avancement des opérations de la veille et a déjà relancé les entreprises retardataires.

Depuis l’introduction de l’IA dans les collectivités locales, les durées des projets d’urbanisme ont été divisées par 5 grâce au temps gagné sur les étapes administratives. La journée s’annonce radieuse, vous rêvez déjà au plongeon dans la Saône après vos 4 heures de durée légale de travail permises par les gains de productivité immenses de l’IA.

Des assistants conversationnels aux agents

Un avenir plus si lointain ? L’IA avance vite, elles sont loin les années 2023 2024 où vous échangiez des messages enfiévrés avec ChatGPT. 2025 et 2026 ont vu l’émergence des agents IA. Un agent IA c’est un LLM qui poursuit un objectif, dispose d’outils pour agir sur le “monde” et d’un moyen de mesurer si l’objectif est atteint ou non.

Vous avez dû entendre parler de Claude code, de Codex ou de Devstral, ces agents qui produisent des applications fonctionnelles à partir d’un simple prompt “fais-moi une appli de covoiturage” : l’objectif est le prompt (ici trop vague pour un résultat probant), les outils sont un moteur d’exécution de code informatique, des capacités de souscrire à des services d’hébergement ou de base de données sur le cloud via des serveurs MCP, et enfin un navigateur web ou autres outils de test pour confirmer si l’objectif est atteint ou non.

L’agent - au moyen de dizaines, centaines ou milliers d’itérations - arrive à son objectif. En 2026 les agents sont capables de mener des tâches pendant plusieurs heures là où les premiers “séchaient” au bout de quelques minutes.

Vous vous souvenez du RAG (Retrieval Augmented Generation) qui faisait fureur en 2024-2025 ? Il n’a pas disparu mais n’est plus qu’un cas particulier de système agentique, appelé plus communément recherche agentique comme expliqué dans ce précédent article de blog.

Openclaw, l’agent poussé jusqu’à l’extrême

Tout début 2026 le projet open source openclaw a connu une forte notoriété, au point que son fondateur a été récruté par OpenAI. Openclaw c’est un agent qui dispose d’outils particulièrement sophistiqués, avec la capacité d’exécuter des tâches sans intervention d’un humain - en réalité des scripts qui “réveillent” l’agent à intervalles réguliers ou selon l’occurrence d’évènements.

On parle aussi de “harnais” (harness) pour décrire tout ce qui permet de contrôler l’agent et donner à ce dernier les moyens d’agir, ou encore d‘“échafaudage” (scaffolding) - parfois dans le sens négatif de l’empêcher de s’effondrer en cassant tout au passage. Pour permettre à openclaw de travailler en toute autonomie, certains sont même allés jusqu’à acheter des ordinateurs dédiés - des mac mini pour la hype - afin d’éviter qu’il reformatte votre disque dur ou envoie vos secrets bancaires au premier hacker venu.

Depuis, Anthropic comme des dizaines d’autres sociétés IA, tentent de répliquer ces fonctionnalités pour rester dans la course aux agents.

Recettes pour de bons agents

Pour être tout à fait honnête, vous devrez encore attendre un peu avant de déléguer à un agent votre plan cyclable. La performance de ces systèmes est encore limitée, le coût est important, et l’autonomie va de pair avec les failles de sécurité. Voici néanmoins quelques repères pour vous guider dans la conception des agents :

L’objectif : comme pour les humains, l’objectif doit être SMA(RT) : Spécifique pour ne pas éparpiller votre LLM et saturer sa fenêtre de contexte, Mesurable pour savoir si l’agent est dans la bonne direction et quand il doit s’arrêter, Atteignable car sinon l’agent peut tourner indéfiniment, et je mets entre parenthèses Réaliste car c’est peu ou prou la même chose qu’atteignable et que Temporellement défini est optionnel car l’agent ira aussi vite qu’il le peut. A noter que l’objectif de l’agent doit être beaucoup plus spécifique que pour un humain - on ne peut pas (encore) dire à un agent d’augmenter les abonnements au pass transport de 10% d’ici la fin de l’année car l’étendue des possibles est trop large (ainsi que toutes les mauvaises idées pour y arriver). L’agent a besoin d’objectifs précis et sur lesquels il peut avoir rapidement un retour.

Le cerveau : le LLM : plus vous aurez un LLM intelligent, notamment qui sache raisonner c’est à dire établir et ajuster un plan pour atteindre l’objectif, plus vous pourrez le laisser libre sans garde-fous et utiliser les outils à sa disposition. Cela permet de passer notamment de workflow très contrôlés de type n8n ou Make à des “systèmes d’exploitation agentiques” où vous faites confiance au LLM pour prendre les bonnes décisions - des frameworks comme LangGraph ou Mistral Studio facilitent l’assemblage entre les composants du système ou son observabilité.

Les outils : certes “mauvais ouvrier ne trouve jamais bon outil” mais votre bon ouvrier de l’étape précédente a besoin de bons outils pour comprendre le monde (son contexte) de manière adéquate et agir sur ce monde, sans réinventer la roue à chaque fois. Exemple : si vous demandez à un agent d’évaluer tous les DPE de votre parc social d’office HLM, mais que vous ne le dotez pas d’un outil de calcul des besoins énergétiques type méthode 3CL, votre agent va soit échouer, soit passer des centaines d’heures à essayer de répliquer un outil qui existe déjà. Le nombre d’outils doit être limité car un LLM peut totalement ignorer les outils s’il y en a trop ou que leur description est insuffisante.

La boucle de mesure : le LLM doit savoir s’il est proche ou non de l’objectif. Pour une appli web, le LLM doit pouvoir au moins lancer un navigateur et simuler le comportement d’un utilisateur. Pour un service de réclamation transports, le retour de l’usager peut l’aider à comprendre si l’objectif de satisfaction est atteint.

L’évaluation externe et le monitoring : comme les résultats d’un LLM ne sont pas déterministes, il vous faut mettre en place les fameuses “eval” qui permettent de mesurer si l’agent atteint ses objectifs, et à quel coût. Cela peut être fait en direct par une note de vos collaborateurs “humains” à chaque résolution de réclamation. Les évaluations commencent d’ailleurs dès la construction de l’agent pour tester sa performance avant un déploiement plus large en production ou sans vérification humaine systématique. Vous devez également surveiller les exécutions, les erreurs rencontrées, les dépenses d’exploitation, comme classiquement dans tout système informatique.

Voici un exemple du tableau de bord que la cheffe de projet de plan cyclable pourrait ouvrir le matin pour constater les progrès de la veille :

Tableau de bord de l'agent plan cyclable — Tableau de bord de l’agent plan cyclable.

Les agents IA ne sont plus de la science-fiction : les briques technologiques sont là, et le défi est désormais de les assembler intelligemment autour de vos métiers. Un objectif précis, un LLM avancé, les bons outils et une boucle de mesure — voici les ingrédients de la réussite.

Vous avez un projet ? Parlons-en !

Contactez-moi pour discuter de vos besoins et construire ensemble un agent IA personnalisé pour accélérer vos collaborateurs. Au plaisir d’échanger !