B One Consulting
·

Build vs Buy. Quand développer son agent IA, quand licencier une plateforme.

La question build ou buy, posée ainsi, est la mauvaise question. La vraie question est de savoir quelles capacités vous devez posséder pour contrôler votre modèle opératoire, et lesquelles vous pouvez louer au marché sans perdre votre marge de manœuvre. La plupart des stacks de production qui valent la peine d'être pilotés sont un mélange, et le travail consiste à tracer la ligne au bon endroit pour votre contexte.

Pourquoi « build vs buy » est un faux binaire.

La conversation build vs buy arrive généralement sous une forme polarisée. Un camp défend l'achat d'une plateforme parce que le marché bouge vite et que les constructions internes sont lentes. L'autre défend la construction parce que les fournisseurs facturent au prix fort des capacités que l'équipe pourrait assembler en un trimestre. Les deux contiennent une part de vérité et passent tous deux à côté du point structurel.

Chaque système IA en production que nous avons aidé à construire, supervisé ou audité a été un mélange. Le modèle lui-même était loué à un fournisseur frontière. Le framework d'orchestration était de l'open source avec des extensions. Le vector store était un service managé. La suite d'évaluation, la piste d'audit et la bibliothèque de prompts étaient construites en interne parce qu'elles encodaient une connaissance spécifique au client. La question que nous posons aux équipes dirigeantes n'est pas de savoir s'il faut construire ou acheter. C'est de savoir quelles couches appartiennent à quelle colonne, et ce que coûte de se tromper sur cette répartition.

D'après notre expérience, le débat build vs buy est presque toujours un proxy pour une autre question. Qui contrôle le rythme de changement. Qui possède la différenciation. Qui porte le risque quand la technologie sous-jacente se déplace sous le système. Ce sont ces conversations qui valent la peine, et le cadre ci-dessous tend à les faire avancer.

Ce que vous devez posséder.

L'ontologie métier.

Par ontologie métier, nous entendons la représentation formelle des entités, des relations et des règles qui définissent votre activité. Ce qu'est un client, ce qu'est une transaction, à quoi ressemble une exception. Ce n'est pas quelque chose qu'un fournisseur peut vous vendre sous une forme générique. La posséder est ce qui permet à toute capacité IA que vous déployez d'être ancrée dans votre réalité plutôt que dans une réalité généralisée. Les équipes qui le font bien passent généralement les premières semaines de tout projet IA sur l'ontologie avant de toucher à un modèle. Celles qui sautent cette étape découvrent que chaque sortie demande un nettoyage substantiel.

Le pipeline d'évaluation.

L'ensemble des cas de test qui définit ce qu'est un bon résultat pour vos agents est une propriété intellectuelle de cœur. Il encode la connaissance des opérateurs, les cas limites, les attentes réglementaires et le ton de voix sous une forme que l'équipe peut exécuter à chaque changement. Louer un framework d'évaluation est raisonnable. Louer les cas eux-mêmes n'a aucun sens. Nous voyons des clients confondre les deux assez souvent pour que ce soit l'un des premiers points que nous examinons en audit.

La piste d'audit.

L'enregistrement de ce que le système a fait, pourquoi, et sous quelle autorité est quelque chose que vous ne pouvez pas vous permettre de laisser stocké uniquement dans la base d'un fournisseur sous sa politique de rétention. Possédez la piste. Recopiez-la dans une infrastructure que vous contrôlez. Les raisons réglementaires et opérationnelles sont bien rodées et le coût de bien le faire est modeste. Le coût de découvrir que vous ne pouvez pas répondre à un régulateur à temps parce que le calendrier d'export du fournisseur est mensuel est significatif.

La bibliothèque de prompts et de politiques.

Les prompts qui définissent la manière dont vos agents raisonnent, les politiques qui gouvernent ce qu'ils peuvent faire et le ton qu'ils appliquent constituent une différenciation. C'est aussi l'endroit où se passe l'itération la plus valorisée pendant la première année d'exploitation. Les garder dans un format propre à un fournisseur qui ne peut pas être migré semble correct jusqu'au jour où vous voulez bouger, moment où le coût de migration peut effacer le gain de vitesse qui avait motivé l'achat initial.

Ce que vous devez louer.

L'accès au modèle.

Le modèle frontière lui-même est l'exemple le plus clair d'une couche à louer. Le rythme d'amélioration des foundation models dépasse de loin ce que toute équipe interne peut suivre, et l'économie de l'entraînement d'un modèle compétitif ne fonctionne pour quasiment aucune entreprise que nous ayons conseillée. Utilisez le meilleur modèle que le marché propose, concevez pour la commutation, et mettez à jour la suite d'évaluation pour détecter les régressions quand vous changez de fournisseur.

La plomberie d'orchestration.

Les frameworks qui câblent ensemble modèles, outils, recherche et mémoire sont assez matures pour qu'en construire un soi-même soit rarement défendable. Les options open source sont crédibles, les options commerciales sont bien supportées, et le capital d'ingénierie épargné en louant cette couche est mieux dépensé sur la suite d'évaluation et la piste d'audit. Les équipes avec qui nous travaillons qui ont construit leur propre orchestration le regrettent généralement en un an, à mesure que l'écosystème open source les rattrape et les dépasse.

L'outillage d'observabilité.

Le tracing, la surveillance de latence, le suivi de coût et la détection de dérive pour les systèmes IA forment une catégorie qui bouge vite avec des fournisseurs spécialisés crédibles. Le construire en interne est coûteux et produit généralement un outil en retard sur le marché. Louez-le, intégrez-le profondément, et possédez les tableaux de bord qui font remonter les signaux à vos opérateurs.

Stockage et recherche vectoriels.

Les bases de données vectorielles managées et les services de recherche ont assez mûri pour que la justification opérationnelle de l'auto-hébergement soit étroite. Quand elle subsiste, c'est généralement pour des raisons réglementaires ou de souveraineté plutôt que de performance. Pour la plupart de nos clients, louer cette couche est le bon choix, sous réserve que l'index puisse être exporté et reconstruit chez un autre fournisseur sans perdre le corpus sous-jacent.

L'enfermement que regrettent les clients est rarement celui qu'ils ont négocié. C'est celui qu'ils n'ont pas négocié, parce que la conversation a été cadrée en build vs buy alors qu'elle portait en réalité sur la marge de manœuvre.

La matrice de décision.

Quand la conversation doit être tranchée rapidement, la matrice que nous utilisons note chaque capacité sur deux axes. La criticité, c'est-à-dire la mesure dans laquelle votre modèle opératoire dépend du bon fonctionnement précis de cette capacité. La différenciation, c'est-à-dire la mesure dans laquelle posséder cette capacité vous sépare de concurrents qui pourraient autrement acheter les mêmes sorties chez les mêmes fournisseurs.

Haute criticité et haute différenciation placent la capacité dans la colonne build. L'ontologie métier et la suite d'évaluation y atterrissent généralement. Faible criticité et faible différenciation la placent fermement dans la colonne rent. Le stockage vectoriel et l'outillage d'observabilité y atterrissent généralement. Les cas intéressants sont sur la diagonale : haute criticité et faible différenciation, ou faible criticité et haute différenciation. Ce sont les cas où la plupart des désaccords se produisent et où la plupart des erreurs d'achat sont commises. La matrice oblige la salle à choisir explicitement plutôt qu'à dériver.

Acheter de la vitesse sans perdre sa marge de manœuvre.

La raison la plus forte d'acheter est la vitesse. Une plateforme qui vous emmène de zéro à une capacité fonctionnelle en quelques semaines a une vraie valeur, et nous n'avons rien à reprocher aux clients qui choisissent d'acheter agressivement pour entrer en production. La conversation que nous insistons pour mener porte sur ce qui se passe au mois dix-huit. Les prompts peuvent-ils être exportés. Les cas d'évaluation peuvent-ils être migrés. La piste d'audit peut-elle être conservée à la fin du contrat. Le fournisseur de modèle peut-il être changé sans reconstruction complète.

Si la réponse à ces quatre questions est oui, acheter est une stratégie saine. Si la réponse à l'une d'elles est non, l'acheteur prend un risque d'une nature différente de celui qu'il réalise probablement. La remise consentie par le fournisseur pour emporter l'affaire est généralement une petite fraction du coût de migration que le client paiera plus tard. Nous avons accompagné des clients dans ce calcul plus d'une fois et la conclusion a été constante.

Si votre équipe approche d'une décision build vs buy et que la conversation se polarise, la question utile à ouvrir n'est pas quel camp a raison. C'est lesquelles, exactement, des capacités, sont de quel côté de la ligne, et quelle marge de manœuvre vous achetez ou vendez dans chaque direction. Les équipes Tech Factory et Consulting de nos bureaux de Paris, Dubaï, Singapour et Bali sont joignables depuis le formulaire ci-dessous.

Questions fréquentes.

Quand le build l'emporte-t-il ?

Quand la capacité est à la fois critique pour le modèle opératoire et source de différenciation. L'ontologie métier, le pipeline d'évaluation, la bibliothèque de prompts et la piste d'audit relèvent presque toujours de ce cas chez nos clients.

Quand le buy l'emporte-t-il ?

Quand le marché bouge plus vite qu'aucune équipe interne ne peut crédiblement suivre, et quand la capacité est une infrastructure non différenciante. Les foundation models, les frameworks d'orchestration, l'outillage d'observabilité et les vector stores managés appartiennent typiquement à cette catégorie.

Comment éviter l'enfermement fournisseur ?

Concevez votre sortie avant de signer. Exigez des formats d'export pour les prompts, les cas d'évaluation et les pistes d'audit. Conservez la couche modèle remplaçable avec un repli qui a été exercé, pas seulement documenté. L'enfermement que regrettent les clients est généralement celui qu'ils n'ont pas négocié quand ils avaient le levier.

Comment garder un coût de build honnête ?

Suivez le coût total, y compris l'exploitation, la rotation d'astreinte et la réécriture éventuelle. La plupart des constructions internes que nous auditons semblaient bon marché au PoC et dépassaient le coût d'une alternative commerciale à la deuxième année. La discipline consiste à estimer le coût sur trois ans, pas sur la première année.

Comment cela change-t-il dans les industries régulées ?

Le biais glisse vers la possession de la piste d'audit, de la bibliothèque de prompts et de la suite d'évaluation, parfois aussi de la couche d'orchestration. Le modèle et l'outillage d'observabilité peuvent rester loués, sous réserve que la résidence des données et les exigences d'audit soient assurées par le fournisseur dans le contrat.

Et les frameworks d'orchestration open source ?

Ils sont crédibles pour la plupart des cas d'usage et le bon choix quand l'équipe dispose de la capacité d'ingénierie pour les étendre. L'erreur à éviter est de traiter l'open source comme gratuit. Le coût opérationnel est réel, et la comparaison avec un framework commercial doit l'intégrer.

Pour aller plus loin

Pour aller plus loin

Comment nous prolongerions ce travail avec vous.

Pilier Tech Factory

IA, Agents & Automatisation

Agents en production, pipelines d'évaluation, observabilité et la discipline derrière la livraison IA.

Pilier Tech Factory

Data, Cloud & DevOps

Plateformes de données, arbitrage cloud souverain, discipline DevOps pour des systèmes qui doivent passer à l'échelle.

Pilier Consulting

Accélération IA

Du diagnostic de maturité à la priorisation des cas d'usage jusqu'à l'adoption durable dans l'organisation.

Cadrons votre pari.

Dites-nous quel moteur vous mobilisez en premier : Consulting ou Tech Factory. Nous répondons sous un jour ouvré.

Démarrer un brief

Parlez-nous
du dossier.

Dites-nous quelle décision vous cherchez à prendre. Stratégie, transformation, performance ou IA. Nous répondons sous un jour ouvré.