Ce qui a changé en 2025

Pendant deux ans, le mot "agent" a surtout servi à vendre des vidéos de démonstration. En 2025, le sujet a commencé à ressembler à une vraie couche d'infrastructure. OpenAI a lancé en mars sa Responses API, ses outils intégrés de web search, file search et computer use, ainsi qu'un Agents SDK assorti de primitives d'observabilité. Google a publié en avril le protocole Agent2Agent, pensé pour permettre à plusieurs agents de communiquer sans être enfermés dans une seule plateforme. Anthropic, de son côté, pousse le Model Context Protocol comme standard d'accès aux outils et aux sources de données, tout en expérimentant computer use sur Claude.

Pris séparément, chacun de ces lancements peut sembler partiel. Pris ensemble, ils forment quelque chose de nouveau : une pile agentique plus lisible. Un modèle pour raisonner, une couche outil pour agir, une couche contexte pour accéder proprement aux données et une couche protocolaire pour dialoguer avec d'autres services. C'est beaucoup plus proche de l'infrastructure logicielle classique que du chatbot monolithique des débuts.

Pourquoi ce déplacement compte

Les entreprises ont déjà appris à leurs dépens qu'un agent impressionnant en sandbox peut devenir inutilisable dès qu'il faut l'auditer, le connecter à des systèmes internes ou lui faire respecter des permissions. C'est exactement là que se joue la nouvelle compétition. OpenAI insiste sur les outils intégrés et la traçabilité de l'orchestration. Google pousse l'interopérabilité inter-agents avec A2A. Anthropic cherche à standardiser le branchement des contextes via MCP et teste une capacité d'action plus directe avec l'usage d'ordinateur. Aucun de ces paris ne remplace les autres ; ils répondent à des goulets différents.

Pour le marché, la conséquence est claire : la qualité d'un agent ne dépend plus seulement du modèle qui répond, mais de la manière dont il appelle un outil, récupère des documents, garde un historique, délègue à un autre agent, échoue proprement et laisse une trace exploitable. C'est précisément ce qui rapproche l'IA agentique des exigences habituelles de production logicielle. La promesse change donc de nature : moins "regardez ce que l'agent sait faire" et plus "regardez comment il s'intègre sans casser votre système".

Ce que les premiers standards disent du marché

L'apparition rapide de standards est un bon indicateur de maturité. Si A2A et MCP gagnent de la traction, c'est parce que les entreprises refusent de reconstruire un connecteur propriétaire pour chaque nouveau modèle et pour chaque nouvel outil. Les protocoles réduisent ce coût de coordination. Ils rendent aussi visible une autre réalité : l'agent réellement utile n'est pas un héros autonome, c'est un nœud dans un système plus large de permissions, de données et de supervision humaine.

Le lancement de computer use rappelle cependant qu'il ne s'agit pas d'une simple histoire de plomberie logicielle. Donner à un agent la capacité d'agir dans une interface ouvre des cas d'usage puissants, mais aussi des risques particuliers : clics non souhaités, escalade involontaire, effets de bord dans des applications fragiles. Les fournisseurs eux-mêmes le présentent comme une capacité à encadrer, pas comme une autonomie magique.

Le nouveau terrain concurrentiel

La compétition se déplace donc vers l'écosystème. Les laboratoires qui gagneront ne seront pas seulement ceux qui publient le meilleur benchmark, mais ceux qui offrent le meilleur ensemble de connecteurs, de protocoles, d'outils d'observabilité et de garde-fous. Cela rapproche l'IA d'une bataille de plateforme. Le modèle reste central, mais il devient une composante d'une chaîne plus large.

Limites et inconnues

Le chantier est loin d'être terminé. Les standards peuvent encore se fragmenter, les évaluations d'agents restent moins robustes que celles des modèles statiques, et la sécurité demeure le point le plus fragile dès qu'un agent agit sur un environnement externe. Mais pour la première fois, le sujet agentique sort clairement du registre de la démo pour entrer dans celui des choix d'architecture. C'est une évolution plus importante qu'une simple nouvelle fonctionnalité produit.