Orchestration multi-agents : coordonner plusieurs agents IA en 2026
Un agent IA seul cherche, raisonne et agit dans une seule fenêtre de contexte. Un système multi-agents répartit le travail entre un agent chef qui planifie et plusieurs sous-agents spécialisés qui avancent en parallèle. Anthropic a mesuré que cette architecture dépasse un agent unique de 90,2 % sur sa propre éval de recherche, au prix d'environ 15 fois plus de jetons. Pour une entreprise belge qui passe des démonstrations à la production, la vraie question n'est pas de savoir si plusieurs agents valent mieux qu'un, mais quand l'orchestration en vaut le coût, et comment la gouverner.
Article généré par l'IA. Contenu rédigé avec l'assistance d'un modèle d'intelligence artificielle, puis relu par un humain avant publication. Les chiffres cités renvoient à leurs sources, listées en fin d'article.
Performance d'un système multi-agents face à un agent unique sur l'éval de recherche d'Anthropic
15×
Jetons consommés par un système multi-agents par rapport à une conversation simple (Anthropic)
50 %
Entreprises utilisant l'IA générative qui auront déployé des agents IA d'ici 2027, contre 25 % en 2025 (Deloitte)
D'un agent unique à une équipe d'agents
Un agent IA, c'est un modèle de langage qui utilise des outils en boucle pour atteindre un objectif : il cherche, lit un résultat, décide de l'étape suivante, recommence. Tant que la tâche tient dans une seule fenêtre de contexte et suit un fil unique, un agent suffit. Le multi-agents commence quand on confie la tâche à plusieurs agents qui se répartissent le travail et avancent en parallèle.
Anthropic décrit le schéma le plus courant : un agent chef analyse la demande, définit une stratégie, puis lance des sous-agents spécialisés qui explorent chacun un angle dans leur propre fenêtre de contexte, avant de lui renvoyer une synthèse. C'est le patron orchestrateur-travailleurs. Son intérêt est précis : chaque sous-agent compresse beaucoup d'information en peu de jetons utiles, ce qui dépasse les limites d'un seul contexte.
Agent unique
Un seul fil, une seule fenêtre de contexte. Simple à construire, à suivre et à déboguer. Adapté aux tâches séquentielles où chaque étape dépend de la précédente.
Système multi-agents
Plusieurs agents en parallèle, coordonnés par un agent chef. Adapté aux tâches larges, à fort volume d'information, où les sous-questions sont indépendantes.
Les patrons d'orchestration
Coordonner des agents n'est pas une recette unique. Quelques patrons reviennent dans les frameworks et les systèmes en production, du plus simple au plus difficile à maîtriser.
Superviseur
Un agent chef décompose la tâche, délègue à des sous-agents et synthétise leurs retours. C'est le patron orchestrateur-travailleurs, le plus répandu en production.
le plus courant
Séquentiel
Les agents se passent le relais dans un ordre fixe, chacun traitant la sortie du précédent. Lisible et prévisible, comme une chaîne de montage.
étapes en chaîne
Hiérarchique
Des superviseurs de superviseurs : un chef coordonne des équipes d'agents. Utile quand les sous-tâches se subdivisent encore.
équipes d'équipes
En réseau
Les agents communiquent directement entre eux, sans chef unique. Puissant, mais plus difficile à contrôler et à tracer.
pair à pair
Ce que le multi-agents apporte vraiment
Les gains ne sont pas théoriques. Sur son éval interne de recherche, Anthropic a constaté qu'un système avec Claude Opus 4 comme agent chef et des sous-agents Claude Sonnet 4 dépassait un agent unique Claude Opus 4 de 90,2 %. L'avantage est net sur les questions larges, où il faut suivre plusieurs pistes indépendantes en même temps.
La parallélisation change aussi le temps de réponse. En lançant 3 à 5 sous-agents en parallèle plutôt qu'en série, Anthropic a réduit le temps de recherche jusqu'à 90 % sur les requêtes complexes. Le facteur dominant n'a rien de mystérieux : dans son analyse, l'usage de jetons explique à lui seul 80 % de l'écart de performance. Plus un système peut dépenser de jetons à bon escient, mieux il répond.
Quand le multi-agents brille
Les tâches à forte parallélisation, où l'information dépasse une seule fenêtre de contexte et où il faut interroger de nombreux outils. La recherche, la veille, la collecte et le recoupement de sources en sont les exemples types. Anthropic cite le cas d'une question large où l'agent unique échoue par recherche séquentielle, alors que le système multi-agents trouve la réponse en répartissant le travail.
Le coût : 15 fois plus de jetons
Cette puissance a un prix direct. Toujours selon Anthropic, un agent consomme environ 4 fois plus de jetons qu'une simple conversation, et un système multi-agents environ 15 fois plus. L'orchestration ne se justifie donc que pour des tâches dont la valeur couvre ce surcoût.
Le multi-agents n'est pas toujours le bon choix. Quand tous les agents doivent partager le même contexte, ou quand les sous-tâches dépendent fortement les unes des autres, la coordination coûte plus qu'elle ne rapporte. Anthropic note que la plupart des tâches de code, moins parallélisables que la recherche, s'y prêtent mal aujourd'hui.
À garder en tête
Gartner prévoit que plus de 40 % des projets d'IA agentique seront abandonnés d'ici fin 2027, faute de valeur claire, de coûts maîtrisés ou de contrôle des risques. Un système mal cadré multiplie les appels d'outils, les jetons et les comportements imprévus : l'un des premiers modes d'échec, chez Anthropic, était de lancer 50 sous-agents pour une question simple. La règle reste la même : commencer petit, mesurer le coût par tâche, plafonner.
Les protocoles qui font parler les agents
Pour que des agents coopèrent, il faut deux types de connexions : relier un agent à des outils et à des données, et relier des agents entre eux. Deux standards ouverts se sont imposés très vite en 2025.
MCP (Anthropic)
Le Model Context Protocol, publié par Anthropic fin 2024, standardise la connexion entre un modèle et des outils ou des sources de données. OpenAI l'a adopté en mars 2025, suivi de Google et de Microsoft. Il s'est imposé comme le port commun entre agents et outils.
A2A (Google)
L'Agent2Agent, annoncé en avril 2025 avec plus de 50 partenaires, permet à des agents de frameworks et d'éditeurs différents de communiquer et de se déléguer des tâches. Confié à la Linux Foundation en juin 2025, il vise une gouvernance neutre.
L'enjeu pratique est l'interopérabilité. Un agent de votre CRM, un agent de votre ERP et un agent maison ne parlent pas la même langue par défaut. MCP leur donne un accès commun aux outils, A2A leur permet de se coordonner. Sans cette couche, chaque intégration reste du sur-mesure fragile, coûteux à maintenir.
Les frameworks d'orchestration
Côté outillage, l'offre s'est étoffée vite. Aucun framework ne domine, et le choix dépend surtout de votre pile technique et de vos contraintes de production.
LangGraph
Orchestration par graphe d'états, avec un contrôle fin des transitions entre agents. Apprécié pour les flux complexes.
CrewAI
Des agents organisés en équipes avec rôles et tâches. Approche simple et lisible pour démarrer.
Microsoft Agent Framework
SDK open source publié en octobre 2025, qui réunit Semantic Kernel et AutoGen. Orienté production, sur .NET et Python.
Google ADK et OpenAI Agents SDK
L'Agent Development Kit de Google (avril 2025) et l'Agents SDK d'OpenAI (mars 2025, issu de Swarm) outillent la construction de systèmes multi-agents.
Ce que ça change pour l'entreprise belge
Là où ça vaut le coût
Les tâches larges et répétitives à forte valeur : veille concurrentielle, analyse documentaire, recoupement de sources, préparation de dossiers. Là, l'orchestration paie son surcoût en jetons.
Là où il faut s'abstenir
Les tâches simples, séquentielles ou très dépendantes d'un contexte partagé. Un seul agent bien outillé y est plus rapide, moins cher et plus facile à tracer.
Un système multi-agents engage des appels d'outils, des données et parfois des dépenses. Les flux passent par plusieurs modèles, éventuellement distants. Maîtriser où tournent les données et qui voit quoi devient central. Un déploiement conforme au RGPD et à l'EU AI Act, sur une infrastructure que l'on contrôle, reste plus simple à gouverner qu'un assemblage opaque de services tiers. Chaque agent qui agit doit être tracé, plafonné et supervisé, par conception.
Par où commencer
1
Choisir une tâche qui s'y prête
Large, parallélisable, à forte valeur. Si un seul agent suffit, s'en tenir là.
2
Définir les rôles et les limites
Agent chef, sous-agents spécialisés, périmètre de chacun. Qui décide, qui exécute, qui valide.
3
Brancher outils et agents proprement
MCP pour les outils, A2A si plusieurs frameworks coexistent. Journaliser chaque appel pour l'audit.
4
Mesurer le coût et garder l'humain
Suivre les jetons par tâche, plafonner, superviser les cas sensibles, documenter pour le régulateur.
Sources
Anthropic, How we built our multi-agent research system (13 juin 2025 ; système multi-agents Claude Opus 4 et sous-agents Sonnet 4 supérieur de 90,2 % à un agent unique, environ 15 fois plus de jetons qu'une conversation, l'usage de jetons explique 80 % de l'écart, patron orchestrateur-travailleurs, 3 à 5 sous-agents en parallèle). anthropic.com
Deloitte, TMT Predictions 2025 (25 % des entreprises utilisant l'IA générative déploient des agents en 2025, 50 % d'ici 2027). deloitte.com
Gartner, Gartner Predicts Over 40% of Agentic AI Projects Will Be Canceled by End of 2027 (25 juin 2025 ; 33 % des logiciels d'entreprise avec IA agentique d'ici 2028 contre moins de 1 % en 2024, plus de 40 % des projets abandonnés d'ici fin 2027). gartner.com
Google Developers Blog, Announcing the Agent2Agent Protocol (A2A) (avril 2025 ; plus de 50 partenaires, protocole confié à la Linux Foundation en juin 2025). developers.googleblog.com
Model Context Protocol (MCP), site officiel, et TechCrunch, OpenAI adopts rival Anthropic's standard for connecting AI models to data (26 mars 2025 ; MCP publié par Anthropic fin 2024, adopté par OpenAI puis Google et Microsoft). modelcontextprotocol.io ; techcrunch.com
Microsoft, Introducing Microsoft Agent Framework (1 octobre 2025 ; SDK open source réunissant Semantic Kernel et AutoGen). devblogs.microsoft.com
Google Developers Blog, Agent Development Kit (avril 2025), et OpenAI, New tools for building agents (Agents SDK, 11 mars 2025, issu de Swarm). developers.googleblog.com ; openai.com
Molderez Consult aide les entreprises belges à décider quand l'orchestration multi-agents en vaut le coût, à choisir patrons, protocoles et frameworks, et à déployer le tout avec traçabilité et gouvernance, sur une infrastructure maîtrisée.
Article généré par l'IA. Contenu rédigé avec l'assistance d'un modèle d'intelligence artificielle, puis relu par un humain avant publication. Les chiffres cités renvoient à leurs sources, listées en fin d'article.
Multi-agent-orkestratie: meerdere AI-agenten coördineren in 2026
Een AI-agent alleen zoekt, redeneert en handelt binnen één contextvenster. Een multi-agentsysteem verdeelt het werk tussen een hoofdagent die plant en meerdere gespecialiseerde subagenten die parallel werken. Anthropic mat dat deze architectuur een enkele agent met 90,2 % overtreft op de eigen research-eval, ten koste van ongeveer 15 keer meer tokens. Voor een Belgisch bedrijf dat van demonstraties naar productie gaat, is de echte vraag niet of meerdere agenten beter zijn dan één, maar wanneer de orkestratie de kosten waard is, en hoe je ze bestuurt.
Artikel gegenereerd door AI. Tekst opgesteld met de hulp van een AI-model en door een mens nagelezen vóór publicatie. De vermelde cijfers verwijzen naar hun bronnen, onderaan dit artikel.
Prestatie van een multi-agentsysteem versus een enkele agent op de research-eval van Anthropic
15×
Tokens verbruikt door een multi-agentsysteem vergeleken met een gewone conversatie (Anthropic)
50 %
Bedrijven met generatieve AI die tegen 2027 agenten hebben ingezet, tegenover 25 % in 2025 (Deloitte)
Van een enkele agent naar een team van agenten
Een AI-agent is een taalmodel dat tools in een lus gebruikt om een doel te bereiken: het zoekt, leest een resultaat, beslist over de volgende stap, begint opnieuw. Zolang de taak in één contextvenster past en één draad volgt, volstaat één agent. Multi-agent begint wanneer je de taak toevertrouwt aan meerdere agenten die het werk verdelen en parallel vooruitgaan.
Anthropic beschrijft het meest voorkomende schema: een hoofdagent analyseert de vraag, bepaalt een strategie en lanceert dan gespecialiseerde subagenten die elk een invalshoek verkennen in hun eigen contextvenster, voor ze een synthese terugsturen. Dat is het orchestrator-worker-patroon. Het nut is precies: elke subagent comprimeert veel informatie tot weinig nuttige tokens, wat de grenzen van één context overstijgt.
Enkele agent
Eén draad, één contextvenster. Eenvoudig te bouwen, te volgen en te debuggen. Geschikt voor sequentiële taken waar elke stap afhangt van de vorige.
Multi-agentsysteem
Meerdere agenten parallel, gecoördineerd door een hoofdagent. Geschikt voor brede taken, met veel informatie, waar de deelvragen onafhankelijk zijn.
De orkestratiepatronen
Agenten coördineren is geen enkel recept. Enkele patronen keren terug in de frameworks en in productiesystemen, van het eenvoudigste tot het moeilijkst te beheersen.
Supervisor
Een hoofdagent ontleedt de taak, delegeert aan subagenten en synthetiseert hun antwoorden. Dat is het orchestrator-worker-patroon, het meest verspreid in productie.
meest gangbaar
Sequentieel
De agenten geven het stokje door in een vaste volgorde, elk verwerkt de output van de vorige. Leesbaar en voorspelbaar, als een montagelijn.
stappen in keten
Hiërarchisch
Supervisors van supervisors: een hoofd coördineert teams van agenten. Nuttig wanneer de deeltaken zich nog verder opsplitsen.
teams van teams
In netwerk
De agenten communiceren rechtstreeks met elkaar, zonder enkele baas. Krachtig, maar moeilijker te controleren en te traceren.
peer to peer
Wat multi-agent echt oplevert
De winst is niet theoretisch. Op de interne research-eval stelde Anthropic vast dat een systeem met Claude Opus 4 als hoofdagent en subagenten Claude Sonnet 4 een enkele agent Claude Opus 4 met 90,2 % overtrof. Het voordeel is duidelijk bij brede vragen, waar je meerdere onafhankelijke sporen tegelijk moet volgen.
De parallellisatie verandert ook de responstijd. Door 3 tot 5 subagenten parallel te lanceren in plaats van in serie, verkortte Anthropic de zoektijd tot 90 % bij complexe vragen. De dominante factor is niet mysterieus: in de analyse verklaart het tokengebruik op zich 80 % van het prestatieverschil. Hoe meer een systeem oordeelkundig tokens kan uitgeven, hoe beter het antwoordt.
Wanneer multi-agent uitblinkt
De taken met sterke parallellisatie, waar de informatie één contextvenster overstijgt en waar je veel tools moet bevragen. Onderzoek, monitoring, het verzamelen en kruisen van bronnen zijn de typevoorbeelden. Anthropic vermeldt een brede vraag waar de enkele agent faalt door sequentieel zoeken, terwijl het multi-agentsysteem het antwoord vindt door het werk te verdelen.
De kost: 15 keer meer tokens
Die kracht heeft een directe prijs. Nog steeds volgens Anthropic verbruikt een agent ongeveer 4 keer meer tokens dan een gewone conversatie, en een multi-agentsysteem ongeveer 15 keer meer. De orkestratie verantwoordt zich dus alleen voor taken waarvan de waarde die meerkost dekt.
Multi-agent is niet altijd de juiste keuze. Wanneer alle agenten dezelfde context moeten delen, of wanneer de deeltaken sterk van elkaar afhangen, kost de coördinatie meer dan ze oplevert. Anthropic merkt op dat de meeste codetaken, minder parallelliseerbaar dan onderzoek, zich er vandaag slecht toe lenen.
Om in gedachten te houden
Gartner voorspelt dat meer dan 40 % van de projecten rond agentische AI tegen eind 2027 wordt stopgezet, bij gebrek aan duidelijke waarde, beheerste kosten of risicocontrole. Een slecht omkaderd systeem vermenigvuldigt de tool-oproepen, de tokens en de onvoorziene gedragingen: een van de eerste faalmodi bij Anthropic was 50 subagenten lanceren voor een eenvoudige vraag. De regel blijft dezelfde: klein beginnen, de kost per taak meten, plafonneren.
De protocollen die agenten doen praten
Opdat agenten samenwerken, zijn er twee soorten verbindingen nodig: een agent verbinden met tools en data, en agenten onderling verbinden. Twee open standaarden braken zeer snel door in 2025.
MCP (Anthropic)
Het Model Context Protocol, eind 2024 gepubliceerd door Anthropic, standaardiseert de verbinding tussen een model en tools of databronnen. OpenAI nam het over in maart 2025, gevolgd door Google en Microsoft. Het werd de gemeenschappelijke poort tussen agenten en tools.
A2A (Google)
Agent2Agent, aangekondigd in april 2025 met meer dan 50 partners, laat agenten van verschillende frameworks en uitgevers toe te communiceren en taken te delegeren. In juni 2025 toevertrouwd aan de Linux Foundation, met het oog op neutraal bestuur.
De praktische inzet is interoperabiliteit. Een agent van je CRM, een agent van je ERP en een eigen agent spreken standaard niet dezelfde taal. MCP geeft hen een gemeenschappelijke toegang tot tools, A2A laat hen toe zich te coördineren. Zonder die laag blijft elke integratie fragiel maatwerk, duur in onderhoud.
De orkestratieframeworks
Aan de gereedschapszijde is het aanbod snel uitgebreid. Geen enkel framework domineert, en de keuze hangt vooral af van je technische stack en je productievereisten.
LangGraph
Orkestratie via een toestandsgraaf, met fijne controle over de overgangen tussen agenten. Gewaardeerd voor complexe stromen.
CrewAI
Agenten georganiseerd in teams met rollen en taken. Een eenvoudige en leesbare aanpak om te starten.
Microsoft Agent Framework
Open source-SDK gepubliceerd in oktober 2025, die Semantic Kernel en AutoGen samenbrengt. Productiegericht, op .NET en Python.
Google ADK en OpenAI Agents SDK
De Agent Development Kit van Google (april 2025) en de Agents SDK van OpenAI (maart 2025, uit Swarm) gereedschappen om multi-agentsystemen te bouwen.
Wat het verandert voor de Belgische onderneming
Waar het de kost waard is
De brede en repetitieve taken met hoge waarde: concurrentiemonitoring, documentanalyse, het kruisen van bronnen, het voorbereiden van dossiers. Daar betaalt de orkestratie haar meerkost in tokens terug.
Waar je je moet onthouden
De eenvoudige, sequentiële taken of die sterk afhangen van een gedeelde context. Eén goed uitgeruste agent is daar sneller, goedkoper en gemakkelijker te traceren.
Een multi-agentsysteem zet tool-oproepen, data en soms uitgaven in. De stromen lopen via meerdere modellen, eventueel op afstand. Beheersen waar de data circuleren en wie wat ziet, wordt centraal. Een uitrol die de AVG en de EU AI Act respecteert, op een infrastructuur die je controleert, blijft eenvoudiger te besturen dan een ondoorzichtige samenstelling van diensten van derden. Elke agent die handelt, moet traceerbaar, geplafonneerd en gesuperviseerd zijn, vanaf het ontwerp.
Waar te beginnen
1
Een geschikte taak kiezen
Breed, parallelliseerbaar, met hoge waarde. Als één agent volstaat, hou het daarbij.
2
De rollen en grenzen bepalen
Hoofdagent, gespecialiseerde subagenten, het bereik van elk. Wie beslist, wie uitvoert, wie valideert.
3
Tools en agenten netjes aansluiten
MCP voor de tools, A2A als meerdere frameworks naast elkaar bestaan. Elke oproep loggen voor de audit.
4
De kost meten en de mens behouden
De tokens per taak volgen, plafonneren, de gevoelige gevallen superviseren, documenteren voor de toezichthouder.
Bronnen
Anthropic, How we built our multi-agent research system (13 juni 2025; multi-agentsysteem Claude Opus 4 met subagenten Sonnet 4 was 90,2 % beter dan een enkele agent, ongeveer 15 keer meer tokens dan een conversatie, tokengebruik verklaart 80 % van het verschil, orchestrator-worker-patroon, 3 tot 5 subagenten parallel). anthropic.com
Deloitte, TMT Predictions 2025 (25 % van de bedrijven met generatieve AI zet agenten in 2025 in, 50 % tegen 2027). deloitte.com
Gartner, Gartner Predicts Over 40% of Agentic AI Projects Will Be Canceled by End of 2027 (25 juni 2025; 33 % van de bedrijfssoftware met agentische AI tegen 2028 tegenover minder dan 1 % in 2024, meer dan 40 % van de projecten stopgezet tegen eind 2027). gartner.com
Google Developers Blog, Announcing the Agent2Agent Protocol (A2A) (april 2025; meer dan 50 partners, protocol toevertrouwd aan de Linux Foundation in juni 2025). developers.googleblog.com
Model Context Protocol (MCP), officiële site, en TechCrunch, OpenAI adopts rival Anthropic's standard for connecting AI models to data (26 maart 2025; MCP eind 2024 door Anthropic gepubliceerd, overgenomen door OpenAI en daarna Google en Microsoft). modelcontextprotocol.io; techcrunch.com
Microsoft, Introducing Microsoft Agent Framework (1 oktober 2025; open source-SDK die Semantic Kernel en AutoGen samenbrengt). devblogs.microsoft.com
Google Developers Blog, Agent Development Kit (april 2025), en OpenAI, New tools for building agents (Agents SDK, 11 maart 2025, uit Swarm). developers.googleblog.com; openai.com
Molderez Consult helpt Belgische bedrijven beslissen wanneer multi-agent-orkestratie de kost waard is, patronen, protocollen en frameworks te kiezen, en het geheel uit te rollen met traceerbaarheid en governance, op een beheerste infrastructuur.
Artikel gegenereerd door AI. Tekst opgesteld met de hulp van een AI-model en door een mens nagelezen vóór publicatie. De vermelde cijfers verwijzen naar hun bronnen, onderaan dit artikel.
Multi-Agent Orchestration: Coordinating Several AI Agents in 2026
A single AI agent searches, reasons and acts within one context window. A multi-agent system splits the work between a lead agent that plans and several specialized subagents that run in parallel. Anthropic measured that this architecture beats a single agent by 90.2% on its own research eval, at the cost of roughly 15 times more tokens. For a Belgian company moving from demos to production, the real question is not whether several agents beat one, but when orchestration is worth the cost, and how to govern it.
Article generated by AI. Content written with the help of an artificial intelligence model and reviewed by a human before publication. The figures cited point to their sources, listed at the end of the article.
Multi-agent system performance over a single agent on Anthropic's research eval
15x
Tokens used by a multi-agent system compared with a plain chat (Anthropic)
50%
Companies using generative AI that will have deployed AI agents by 2027, up from 25% in 2025 (Deloitte)
From a Single Agent to a Team of Agents
An AI agent is a language model that uses tools in a loop to reach a goal: it searches, reads a result, decides the next step, repeats. As long as the task fits in one context window and follows a single thread, one agent is enough. Multi-agent starts when you hand the task to several agents that split the work and move in parallel.
Anthropic describes the most common pattern: a lead agent analyzes the request, sets a strategy, then spawns specialized subagents that each explore an angle in their own context window before returning a synthesis. That is the orchestrator-worker pattern. Its benefit is precise: each subagent compresses a lot of information into few useful tokens, which goes beyond the limits of a single context.
Single agent
One thread, one context window. Simple to build, follow and debug. Suited to sequential tasks where each step depends on the previous one.
Multi-agent system
Several agents in parallel, coordinated by a lead agent. Suited to broad tasks, with a high volume of information, where the sub-questions are independent.
The Orchestration Patterns
Coordinating agents is not a single recipe. A few patterns recur in frameworks and production systems, from the simplest to the hardest to control.
Supervisor
A lead agent breaks down the task, delegates to subagents and synthesizes their answers. This is the orchestrator-worker pattern, the most common in production.
most common
Sequential
Agents pass the baton in a fixed order, each processing the previous one's output. Readable and predictable, like an assembly line.
chained steps
Hierarchical
Supervisors of supervisors: a lead coordinates teams of agents. Useful when subtasks split further down.
teams of teams
Network
Agents talk directly to each other, with no single lead. Powerful, but harder to control and trace.
peer to peer
What Multi-Agent Actually Delivers
The gains are not theoretical. On its internal research eval, Anthropic found that a system with Claude Opus 4 as the lead agent and Claude Sonnet 4 subagents beat a single-agent Claude Opus 4 by 90.2%. The advantage is clear on broad questions, where several independent leads must be followed at once.
Parallelization also changes response time. By spinning up 3 to 5 subagents in parallel rather than serially, Anthropic cut research time by up to 90% on complex queries. The dominant factor is no mystery: in its analysis, token usage alone explains 80% of the performance gap. The more a system can spend tokens wisely, the better it answers.
Where multi-agent shines
Tasks with heavy parallelization, where information exceeds a single context window and many tools must be queried. Research, monitoring, collecting and cross-checking sources are the typical examples. Anthropic cites a broad question where the single agent fails through sequential search, while the multi-agent system finds the answer by splitting the work.
The Cost: 15 Times More Tokens
This power has a direct price. Still according to Anthropic, an agent uses about 4 times more tokens than a plain chat, and a multi-agent system about 15 times more. Orchestration is therefore only justified for tasks whose value covers that extra cost.
Multi-agent is not always the right choice. When all agents must share the same context, or when subtasks depend heavily on one another, coordination costs more than it returns. Anthropic notes that most coding tasks, less parallelizable than research, are a poor fit today.
Worth keeping in mind
Gartner forecasts that over 40% of agentic AI projects will be canceled by the end of 2027, for lack of clear value, controlled costs or risk controls. A poorly scoped system multiplies tool calls, tokens and unexpected behavior: one of the first failure modes at Anthropic was spawning 50 subagents for a simple query. The rule stays the same: start small, measure the cost per task, cap it.
The Protocols That Make Agents Talk
For agents to cooperate, two kinds of connections are needed: linking an agent to tools and data, and linking agents to each other. Two open standards took hold very fast in 2025.
MCP (Anthropic)
The Model Context Protocol, published by Anthropic in late 2024, standardizes the connection between a model and tools or data sources. OpenAI adopted it in March 2025, followed by Google and Microsoft. It became the common port between agents and tools.
A2A (Google)
Agent2Agent, announced in April 2025 with more than 50 partners, lets agents from different frameworks and vendors communicate and delegate tasks. Handed to the Linux Foundation in June 2025, it aims for neutral governance.
The practical issue is interoperability. An agent from your CRM, an agent from your ERP and an in-house agent do not speak the same language by default. MCP gives them common access to tools, A2A lets them coordinate. Without that layer, every integration stays fragile, custom-built and costly to maintain.
The Orchestration Frameworks
On the tooling side, the offering has grown fast. No framework dominates, and the choice mostly depends on your tech stack and your production constraints.
LangGraph
Orchestration through a state graph, with fine control over transitions between agents. Popular for complex flows.
CrewAI
Agents organized into crews with roles and tasks. A simple, readable approach to get started.
Microsoft Agent Framework
Open-source SDK released in October 2025, bringing together Semantic Kernel and AutoGen. Production-oriented, on .NET and Python.
Google ADK and OpenAI Agents SDK
Google's Agent Development Kit (April 2025) and OpenAI's Agents SDK (March 2025, from Swarm) tool the building of multi-agent systems.
What It Changes for the Belgian Company
Where it is worth the cost
Broad, repetitive, high-value tasks: competitive monitoring, document analysis, cross-checking sources, preparing case files. There, orchestration pays back its token overhead.
Where to refrain
Simple, sequential tasks, or ones that depend heavily on a shared context. A single well-equipped agent is faster, cheaper and easier to trace.
A multi-agent system commits tool calls, data and sometimes spending. Flows pass through several models, possibly remote. Controlling where the data goes and who sees what becomes central. A rollout that respects the GDPR and the EU AI Act, on infrastructure you control, stays simpler to govern than an opaque assembly of third-party services. Every agent that acts must be traceable, capped and supervised, by design.
Where to Start
1
Pick a task that fits
Broad, parallelizable, high-value. If a single agent is enough, stop there.
2
Define the roles and limits
Lead agent, specialized subagents, the scope of each. Who decides, who executes, who validates.
3
Wire tools and agents cleanly
MCP for tools, A2A if several frameworks coexist. Log every call for the audit.
4
Measure the cost and keep the human
Track tokens per task, cap them, supervise sensitive cases, document for the regulator.
Sources
Anthropic, How we built our multi-agent research system (13 June 2025; a multi-agent system with Claude Opus 4 and Sonnet 4 subagents outperformed a single agent by 90.2%, about 15 times more tokens than a chat, token usage explains 80% of the gap, orchestrator-worker pattern, 3 to 5 subagents in parallel). anthropic.com
Deloitte, TMT Predictions 2025 (25% of companies using generative AI deploy agents in 2025, 50% by 2027). deloitte.com
Gartner, Gartner Predicts Over 40% of Agentic AI Projects Will Be Canceled by End of 2027 (25 June 2025; 33% of enterprise software with agentic AI by 2028 versus less than 1% in 2024, over 40% of projects canceled by end of 2027). gartner.com
Google Developers Blog, Announcing the Agent2Agent Protocol (A2A) (April 2025; more than 50 partners, protocol handed to the Linux Foundation in June 2025). developers.googleblog.com
Model Context Protocol (MCP), official site, and TechCrunch, OpenAI adopts rival Anthropic's standard for connecting AI models to data (26 March 2025; MCP published by Anthropic in late 2024, adopted by OpenAI then Google and Microsoft). modelcontextprotocol.io; techcrunch.com
Microsoft, Introducing Microsoft Agent Framework (1 October 2025; open-source SDK bringing together Semantic Kernel and AutoGen). devblogs.microsoft.com
Google Developers Blog, Agent Development Kit (April 2025), and OpenAI, New tools for building agents (Agents SDK, 11 March 2025, from Swarm). developers.googleblog.com; openai.com
Molderez Consult helps Belgian companies decide when multi-agent orchestration is worth the cost, choose patterns, protocols and frameworks, and deploy the whole with traceability and governance, on infrastructure they control.
Article generated by AI. Content written with the help of an artificial intelligence model and reviewed by a human before publication. The figures cited point to their sources, listed at the end of the article.