Buy Crypto Markets Spot FuturesDELL Earn Event Center

Les entreprises découvrent que créer des Agents d'IA est facile comparé à la construction des systèmes qui rendent ces agents fiables en production. Les équipes d'IA en entrepriseLes entreprises découvrent que créer des Agents d'IA est facile comparé à la construction des systèmes qui rendent ces agents fiables en production. Les équipes d'IA en entreprise

Vous avez déployé 50 000 Agents d'IA. Et maintenant ? Le problème d'infrastructure de responsabilité que les entreprises continuent d'ignorer

Source : Techbullion

2026/05/30 14:28

Temps de lecture : 5 min

AI$0.02906-5.77%

Pour tout commentaire ou toute question concernant ce contenu, veuillez nous contacter à l'adresse suivante : crypto.news@mexc.com

Les entreprises découvrent que créer des Agents d'IA est facile comparé à construire les systèmes qui rendent ces agents dignes de confiance en production.

Les équipes d'IA d'entreprise ont passé les deux dernières années à se précipiter pour créer des agents. Elles se heurtent maintenant à un problème différent : très peu de ces agents peuvent réellement être utilisés à grande échelle en toute confiance.

You Deployed 50,000 Agents. Now What? The Accountability Infrastructure Problem Enterprises Keep Ignoring

L'écart commence à apparaître dans les chiffres publics. Prosus aurait construit 50 000 agents en interne, mais seulement environ 5 000 fonctionnent quotidiennement. Ce ratio de 10 pour 1 est devenu une métrique révélatrice de l'état actuel de la production d'IA en entreprise. La question n'est pas de savoir si les entreprises peuvent créer des agents. C'est de savoir si elles peuvent déterminer de manière fiable quels agents sont sûrs à déployer, quelles sorties sont dignes de confiance, et ce qui se passe lorsque les systèmes échouent.

Cette distinction est importante car l'efficacité promise des systèmes autonomes suppose que les systèmes prennent des décisions correctes en premier lieu.

L'écart entre expérimentation et production

Pour de nombreuses équipes d'ingénierie, la première vague de déploiement d'Agents d'IA a progressé rapidement. Des copilotes internes, des automatiseurs de flux de travail et des systèmes multi-agents sont apparus dans tous les départements. Les démonstrations ont fonctionné. Les programmes pilotes semblaient prometteurs.

Les environnements de production ont raconté une histoire différente.

Antonio Bustamante, PDG de bem, a passé des années à travailler sur l'infrastructure d'IA pour les secteurs réglementés, notamment l'assurance, la finance et la santé. De son point de vue, le plus grand goulot d'étranglement de l'industrie est la responsabilité.

Il cite un incident largement discuté impliquant Upstream, dans lequel un Agent d'IA a rejoint un canal Slack, et l'équipe humaine est apparemment restée silencieuse pendant 24 heures parce que personne ne savait comment interagir avec lui. Bustamante soutient que le silence a révélé quelque chose de plus profond : les entreprises n'ont pas conçu de modèles opérationnels pour travailler aux côtés des agents.

Le même schéma apparaît dans les déploiements d'entreprise à grande échelle. Les équipes peuvent rapidement générer des milliers d'agents, mais l'utilisation diminue une fois que ces systèmes rencontrent des données de production désordonnées, une propriété peu claire ou des sorties incertaines.

C'est pourquoi de nombreuses entreprises se retrouvent maintenant avec des efforts étendus de déploiement d'Agents d'IA mais relativement peu de production d'IA d'entreprise réelle.

Pourquoi les systèmes multi-agents continuent de stagner

Une partie du problème vient de la façon dont les environnements d'entreprise fonctionnent réellement.

Dans les démonstrations contrôlées, les données sont propres et les flux de travail sont prévisibles. Les vraies organisations fonctionnent rarement de cette façon. La plupart des systèmes d'entreprise contiennent des enregistrements fragmentés, des formats incohérents, un contexte manquant et des années de solutions de contournement opérationnelles accumulées.

Bustamante compare la situation à la chaîne d'assemblage. Le modèle de fabrication de Henry Ford a réussi parce que les intrants étaient standardisés avant que la production ne soit mise à l'échelle. Les systèmes multi-agents font face à la condition opposée. Ils sont censés fonctionner sur des données d'entreprise non standardisées, ce qui est caractéristique de la plupart des environnements d'entreprise.

Certaines entreprises ont déjà publiquement reconnu la charge opérationnelle. Dans plusieurs déploiements, les organisations se sont retrouvées à affecter des examinateurs humains pour revoir en continu les sorties des agents. Dans un exemple circulant dans l'industrie, un système multi-agents aurait nécessité 20 personnes pour valider les résultats en coulisses.

Cela change complètement l'économie. Les gains promis du déploiement d'agents autonomes disparaissent si les humains ont encore besoin de vérifier manuellement chaque décision.

Le score de confiance et la couche de responsabilité manquante

Bustamante soutient que le score de confiance est devenu l'un des composants les plus négligés de la gouvernance de l'IA et de la production d'infrastructure d'IA. Sans systèmes capables de mesurer l'incertitude, les opérateurs n'ont aucun moyen fiable de déterminer quels agents sont prêts pour la production et lesquels nécessitent une intervention.

En pratique, le score de confiance signifie plus qu'attribuer un pourcentage à une réponse. Il nécessite des systèmes capables d'expliquer l'incertitude, de retracer les décisions jusqu'aux données sources et de créer des points de contrôle avec intervention humaine avant que les erreurs ne se cumulent dans les flux de travail.

Cette couche de responsabilité de l'IA devient particulièrement importante dans les secteurs où les erreurs ont des conséquences financières ou juridiques. Un examen de réclamation d'assurance échoué, une erreur d'extraction dans le domaine de la santé ou une erreur de traitement financier peut devenir un événement de responsabilité.

Bustamante décrit la thèse plus large de bem comme « La plateforme d'orchestration d'agents pour les choses qui ne peuvent pas échouer. » La phrase reflète une prise de conscience croissante dans l'industrie : la fiabilité des Agents d'IA dépend moins du nombre d'agents que vous déployez et davantage de votre capacité à tracer, auditer et corriger les décisions lorsque quelque chose tourne mal.

À quoi ressemble une infrastructure prête pour la production

La prochaine phase de l'IA d'entreprise pourrait avoir moins à voir avec la création de davantage d'agents et davantage avec la construction de systèmes autour d'eux.

Les entreprises axées sur l'utilisation à long terme des Agents d'IA recherchent de plus en plus une infrastructure qui reste flexible lors de l'exécution, est rigide dans les résultats et est traçable dans des conditions d'échec. Cela inclut le score de confiance, les pistes d'audit, les points d'intervention, la standardisation des données et les systèmes de gouvernance conçus pour la production, et non pour les démonstrations.

Les entreprises qui comblent le fossé entre l'expérimentation des systèmes multi-agents et le déploiement dans le monde réel ne seront peut-être pas celles qui ont le plus d'agents. Ce seront peut-être celles qui construisent enfin l'infrastructure de responsabilité que les entreprises ont ignorée la première fois.