Retour au blog
Technique 10 min

Orchestration multi-agents : coordonner plusieurs agents IA en 2026

Un agent IA seul cherche, raisonne et agit dans une seule fenêtre de contexte. Un système multi-agents répartit le travail entre un agent chef qui planifie et plusieurs sous-agents spécialisés qui avancent en parallèle. Anthropic a mesuré que cette architecture dépasse un agent unique de 90,2 % sur sa propre éval de recherche, au prix d'environ 15 fois plus de jetons. Pour une entreprise belge qui passe des démonstrations à la production, la vraie question n'est pas de savoir si plusieurs agents valent mieux qu'un, mais quand l'orchestration en vaut le coût, et comment la gouverner.

Article généré par l'IA. Contenu rédigé avec l'assistance d'un modèle d'intelligence artificielle, puis relu par un humain avant publication. Les chiffres cités renvoient à leurs sources, listées en fin d'article.

Le multi-agents en chiffres

+90,2 %
Performance d'un système multi-agents face à un agent unique sur l'éval de recherche d'Anthropic
15×
Jetons consommés par un système multi-agents par rapport à une conversation simple (Anthropic)
50 %
Entreprises utilisant l'IA générative qui auront déployé des agents IA d'ici 2027, contre 25 % en 2025 (Deloitte)

D'un agent unique à une équipe d'agents

Un agent IA, c'est un modèle de langage qui utilise des outils en boucle pour atteindre un objectif : il cherche, lit un résultat, décide de l'étape suivante, recommence. Tant que la tâche tient dans une seule fenêtre de contexte et suit un fil unique, un agent suffit. Le multi-agents commence quand on confie la tâche à plusieurs agents qui se répartissent le travail et avancent en parallèle.

Anthropic décrit le schéma le plus courant : un agent chef analyse la demande, définit une stratégie, puis lance des sous-agents spécialisés qui explorent chacun un angle dans leur propre fenêtre de contexte, avant de lui renvoyer une synthèse. C'est le patron orchestrateur-travailleurs. Son intérêt est précis : chaque sous-agent compresse beaucoup d'information en peu de jetons utiles, ce qui dépasse les limites d'un seul contexte.

Agent unique

Un seul fil, une seule fenêtre de contexte. Simple à construire, à suivre et à déboguer. Adapté aux tâches séquentielles où chaque étape dépend de la précédente.

Système multi-agents

Plusieurs agents en parallèle, coordonnés par un agent chef. Adapté aux tâches larges, à fort volume d'information, où les sous-questions sont indépendantes.

Les patrons d'orchestration

Coordonner des agents n'est pas une recette unique. Quelques patrons reviennent dans les frameworks et les systèmes en production, du plus simple au plus difficile à maîtriser.

Superviseur

Un agent chef décompose la tâche, délègue à des sous-agents et synthétise leurs retours. C'est le patron orchestrateur-travailleurs, le plus répandu en production.

le plus courant

Séquentiel

Les agents se passent le relais dans un ordre fixe, chacun traitant la sortie du précédent. Lisible et prévisible, comme une chaîne de montage.

étapes en chaîne

Hiérarchique

Des superviseurs de superviseurs : un chef coordonne des équipes d'agents. Utile quand les sous-tâches se subdivisent encore.

équipes d'équipes

En réseau

Les agents communiquent directement entre eux, sans chef unique. Puissant, mais plus difficile à contrôler et à tracer.

pair à pair

Ce que le multi-agents apporte vraiment

Les gains ne sont pas théoriques. Sur son éval interne de recherche, Anthropic a constaté qu'un système avec Claude Opus 4 comme agent chef et des sous-agents Claude Sonnet 4 dépassait un agent unique Claude Opus 4 de 90,2 %. L'avantage est net sur les questions larges, où il faut suivre plusieurs pistes indépendantes en même temps.

La parallélisation change aussi le temps de réponse. En lançant 3 à 5 sous-agents en parallèle plutôt qu'en série, Anthropic a réduit le temps de recherche jusqu'à 90 % sur les requêtes complexes. Le facteur dominant n'a rien de mystérieux : dans son analyse, l'usage de jetons explique à lui seul 80 % de l'écart de performance. Plus un système peut dépenser de jetons à bon escient, mieux il répond.

Quand le multi-agents brille

Les tâches à forte parallélisation, où l'information dépasse une seule fenêtre de contexte et où il faut interroger de nombreux outils. La recherche, la veille, la collecte et le recoupement de sources en sont les exemples types. Anthropic cite le cas d'une question large où l'agent unique échoue par recherche séquentielle, alors que le système multi-agents trouve la réponse en répartissant le travail.

Le coût : 15 fois plus de jetons

Cette puissance a un prix direct. Toujours selon Anthropic, un agent consomme environ 4 fois plus de jetons qu'une simple conversation, et un système multi-agents environ 15 fois plus. L'orchestration ne se justifie donc que pour des tâches dont la valeur couvre ce surcoût.

Le multi-agents n'est pas toujours le bon choix. Quand tous les agents doivent partager le même contexte, ou quand les sous-tâches dépendent fortement les unes des autres, la coordination coûte plus qu'elle ne rapporte. Anthropic note que la plupart des tâches de code, moins parallélisables que la recherche, s'y prêtent mal aujourd'hui.

À garder en tête

Gartner prévoit que plus de 40 % des projets d'IA agentique seront abandonnés d'ici fin 2027, faute de valeur claire, de coûts maîtrisés ou de contrôle des risques. Un système mal cadré multiplie les appels d'outils, les jetons et les comportements imprévus : l'un des premiers modes d'échec, chez Anthropic, était de lancer 50 sous-agents pour une question simple. La règle reste la même : commencer petit, mesurer le coût par tâche, plafonner.

Les protocoles qui font parler les agents

Pour que des agents coopèrent, il faut deux types de connexions : relier un agent à des outils et à des données, et relier des agents entre eux. Deux standards ouverts se sont imposés très vite en 2025.

MCP (Anthropic)

Le Model Context Protocol, publié par Anthropic fin 2024, standardise la connexion entre un modèle et des outils ou des sources de données. OpenAI l'a adopté en mars 2025, suivi de Google et de Microsoft. Il s'est imposé comme le port commun entre agents et outils.

A2A (Google)

L'Agent2Agent, annoncé en avril 2025 avec plus de 50 partenaires, permet à des agents de frameworks et d'éditeurs différents de communiquer et de se déléguer des tâches. Confié à la Linux Foundation en juin 2025, il vise une gouvernance neutre.

L'enjeu pratique est l'interopérabilité. Un agent de votre CRM, un agent de votre ERP et un agent maison ne parlent pas la même langue par défaut. MCP leur donne un accès commun aux outils, A2A leur permet de se coordonner. Sans cette couche, chaque intégration reste du sur-mesure fragile, coûteux à maintenir.

Les frameworks d'orchestration

Côté outillage, l'offre s'est étoffée vite. Aucun framework ne domine, et le choix dépend surtout de votre pile technique et de vos contraintes de production.

LangGraph

Orchestration par graphe d'états, avec un contrôle fin des transitions entre agents. Apprécié pour les flux complexes.

CrewAI

Des agents organisés en équipes avec rôles et tâches. Approche simple et lisible pour démarrer.

Microsoft Agent Framework

SDK open source publié en octobre 2025, qui réunit Semantic Kernel et AutoGen. Orienté production, sur .NET et Python.

Google ADK et OpenAI Agents SDK

L'Agent Development Kit de Google (avril 2025) et l'Agents SDK d'OpenAI (mars 2025, issu de Swarm) outillent la construction de systèmes multi-agents.

Ce que ça change pour l'entreprise belge

Là où ça vaut le coût

Les tâches larges et répétitives à forte valeur : veille concurrentielle, analyse documentaire, recoupement de sources, préparation de dossiers. Là, l'orchestration paie son surcoût en jetons.

Là où il faut s'abstenir

Les tâches simples, séquentielles ou très dépendantes d'un contexte partagé. Un seul agent bien outillé y est plus rapide, moins cher et plus facile à tracer.

Un système multi-agents engage des appels d'outils, des données et parfois des dépenses. Les flux passent par plusieurs modèles, éventuellement distants. Maîtriser où tournent les données et qui voit quoi devient central. Un déploiement conforme au RGPD et à l'EU AI Act, sur une infrastructure que l'on contrôle, reste plus simple à gouverner qu'un assemblage opaque de services tiers. Chaque agent qui agit doit être tracé, plafonné et supervisé, par conception.

Par où commencer

1

Choisir une tâche qui s'y prête

Large, parallélisable, à forte valeur. Si un seul agent suffit, s'en tenir là.

2

Définir les rôles et les limites

Agent chef, sous-agents spécialisés, périmètre de chacun. Qui décide, qui exécute, qui valide.

3

Brancher outils et agents proprement

MCP pour les outils, A2A si plusieurs frameworks coexistent. Journaliser chaque appel pour l'audit.

4

Mesurer le coût et garder l'humain

Suivre les jetons par tâche, plafonner, superviser les cas sensibles, documenter pour le régulateur.

Sources

  1. Anthropic, How we built our multi-agent research system (13 juin 2025 ; système multi-agents Claude Opus 4 et sous-agents Sonnet 4 supérieur de 90,2 % à un agent unique, environ 15 fois plus de jetons qu'une conversation, l'usage de jetons explique 80 % de l'écart, patron orchestrateur-travailleurs, 3 à 5 sous-agents en parallèle). anthropic.com
  2. Deloitte, TMT Predictions 2025 (25 % des entreprises utilisant l'IA générative déploient des agents en 2025, 50 % d'ici 2027). deloitte.com
  3. Gartner, Gartner Predicts Over 40% of Agentic AI Projects Will Be Canceled by End of 2027 (25 juin 2025 ; 33 % des logiciels d'entreprise avec IA agentique d'ici 2028 contre moins de 1 % en 2024, plus de 40 % des projets abandonnés d'ici fin 2027). gartner.com
  4. Google Developers Blog, Announcing the Agent2Agent Protocol (A2A) (avril 2025 ; plus de 50 partenaires, protocole confié à la Linux Foundation en juin 2025). developers.googleblog.com
  5. Model Context Protocol (MCP), site officiel, et TechCrunch, OpenAI adopts rival Anthropic's standard for connecting AI models to data (26 mars 2025 ; MCP publié par Anthropic fin 2024, adopté par OpenAI puis Google et Microsoft). modelcontextprotocol.io ; techcrunch.com
  6. Microsoft, Introducing Microsoft Agent Framework (1 octobre 2025 ; SDK open source réunissant Semantic Kernel et AutoGen). devblogs.microsoft.com
  7. Google Developers Blog, Agent Development Kit (avril 2025), et OpenAI, New tools for building agents (Agents SDK, 11 mars 2025, issu de Swarm). developers.googleblog.com ; openai.com

Plusieurs agents, ou un seul bien outillé ?

Molderez Consult aide les entreprises belges à décider quand l'orchestration multi-agents en vaut le coût, à choisir patrons, protocoles et frameworks, et à déployer le tout avec traçabilité et gouvernance, sur une infrastructure maîtrisée.

Parler de mon cas d'usage
Article généré par l'IA. Contenu rédigé avec l'assistance d'un modèle d'intelligence artificielle, puis relu par un humain avant publication. Les chiffres cités renvoient à leurs sources, listées en fin d'article.