anticipated catalyst · technology

La compression des coûts d'inférence IA : comment DeepSeek force les hyperscalers à abandonner leurs marges

published 6/11/2026

Le basculement à un million de dollars

Début 2026, une startup d'agents IA appelée Lindy a divulgué publiquement qu'elle était passée de Claude d'Anthropic à DeepSeek pour l'inférence et économisait désormais des millions de dollars. Ce n'était pas un article de recherche. Ce n'était pas un benchmark. C'était une décision de déploiement en production par une entreprise dont l'économie unitaire dépend des coûts d'inférence — et elle a été suivie par une vague d'annonces similaires d'entreprises expérimentant DeepSeek, souvent hébergé via des plateformes tierces comme Together AI, Atlas Cloud ou Lightning AI Hub qui encapsulent les modèles DeepSeek avec des SLA de disponibilité à 99,9% et un support entreprise.

L'écart de prix est structurel, pas marginal. DeepSeek-V3 coûte environ 0,14$ par million de tokens en entrée et 0,28$ par million de tokens en sortie, contre 2,50$/10,00$ pour GPT-4o et 3,00$/15,00$ pour Claude Sonnet 4.6. Cela représente un avantage de coût de 18–21× en entrée et de 36–54× en sortie, avant même les remises sur volume. Pour une entreprise traitant 10 millions de tokens par jour — une charge de travail de production modeste — la facture d'inférence annuelle passe d'environ 36 millions de dollars sur GPT-4o à moins de 2 millions de dollars sur DeepSeek-V3. Ce ne sont pas des erreurs d'arrondi. Ce sont des différences qui redéfinissent les budgets.

La réponse d'Anthropic a été immédiate et défensive : elle a doublé les limites Claude Cowork sans frais supplémentaires et lancé Fable 5 (classe Mythos) avec une fenêtre de disponibilité limitée, deux manœuvres conçues pour retenir les développeurs avant qu'ils ne défectent vers des alternatives moins chères. Microsoft a annoncé que son runtime d'agents est désormais gratuit, positionnant explicitement Azure Foundry, Visual Studio et GitHub comme les couches de verrouillage tout en concédant que le runtime lui-même — la couche d'inférence — n'est plus une source de marge défendable. Ce ne sont pas les actions d'entreprises confiantes dans leur pouvoir de fixation des prix.

Pourquoi les marges IA des hyperscalers vont s'effondrer

Le marché de l'infrastructure IA en 2024–2025 se situe à l'intersection d'une demande explosive de calcul d'inférence, d'un oligopole cloud mature confronté à sa première menace crédible sur les marges depuis une décennie, et d'un environnement de coûts qui force les entreprises à traiter les dépenses IA comme un poste budgétaire plutôt qu'un budget d'innovation. Les hyperscalers — Microsoft Azure, AWS et Google Cloud — ont passé les trois dernières années à construire des clusters GPU et des accélérateurs personnalisés pour capter ce qu'ils croyaient être un boom d'infrastructure IA soutenu et à forte marge.

Microsoft a explicitement divulgué en FY25 que la mise à l'échelle de l'infrastructure IA a fait baisser sa marge brute Microsoft Cloud à 69%, un aveu rare de pression sur les coûts dans un segment qui imprimait historiquement des marges brutes de 70%+. AWS mène le plus grand programme de dépenses d'investissement de son histoire pour développer sa capacité IA, et l'expansion de la marge de Google Cloud de 9,4% à 32,9% en une seule année reflète une montée en échelle aggressive plutôt que des économies unitaires durables. L'hypothèse de base intégrée dans les valorisations des hyperscalers est que l'inférence IA suivra le playbook des guerres de prix cloud de 2010–2015 : des baisses de prix visibles, mais des marges défendues par l'échelle, l'efficacité et le verrouillage de l'écosystème.

Ce playbook a fonctionné parce qu'AWS, Azure et GCP se faisaient concurrence entre eux et contre l'infrastructure legacy sur site, pas contre un paradigme architectural fondamentalement moins cher. Les modèles Mixture-of-Experts de DeepSeek, qui n'activent que 37B de 671B paramètres par token, représentent une amélioration par palier de l'efficacité des coûts que les hyperscalers ne peuvent pas facilement répliquer sans cannibaliser leurs flottes GPU existantes. La guerre des prix AWS de 2010–2015 est instructive : AWS a réduit les prix de stockage S3 de plus de 80% entre 2010 et 2016, mais les marges brutes se sont élargies du haut des 40% au bas des 60% parce que la courbe de coûts a baissé plus vite que les prix. La différence aujourd'hui est que DeepSeek et les modèles à poids ouverts ne sont pas seulement moins chers — ils sont architecturalement différents, et ils sont adoptés par des entreprises qui ont déjà construit l'infrastructure MLOps et de gouvernance pour les exécuter.

Le marché de la gouvernance et de l'observabilité IA, actuellement autour de 1,5–3 milliards de dollars mondialement, croît de 25–40% annuellement précisément parce que les entreprises passent de la phase pilote "essayons GPT-4" à la phase production "nous avons besoin de contrôles de politique, de gestion des coûts et de routage multi-modèles". Ce n'est pas une histoire d'effondrement de la demande IA — c'est une histoire de fragmentation de la pile de valeur, avec l'inférence devenant un intrant commoditisé et la vraie marge revenant aux couches d'orchestration, de gouvernance et de données qui se situent au-dessus.

Le marché s'ancre sur le mauvais précédent

Le marché valorise l'infrastructure IA des hyperscalers comme une activité soutenue à forte marge parce qu'il s'ancre sur la guerre des prix cloud de 2010–2015, où AWS a réduit les prix agressivement mais les marges se sont élargies. La vision consensuelle est qu'Azure, AWS et GCP défendront les marges d'inférence IA de la même manière : par l'échelle, les gains d'efficacité et le verrouillage de l'écosystème. Cette vision est fausse pour trois raisons.

Premièrement, la guerre des prix de 2010–2015 était une compétition entre hyperscalers et contre l'infrastructure legacy sur site ; la compétition d'aujourd'hui est contre un paradigme architectural fondamentalement moins cher que les hyperscalers ne peuvent pas facilement répliquer sans échouer leurs investissements GPU existants. Deuxièmement, les manœuvres défensives des hyperscalers — runtimes d'agents gratuits, limites Cowork doublées, sorties Mythos à durée limitée — ne sont pas les actions d'entreprises avec un pouvoir de fixation des prix ; ce sont les actions d'entreprises essayant de ralentir la défection. Troisièmement, les données de sensibilité aux coûts IA des entreprises montrent que l'inférence est déjà un coût minoritaire, représentant seulement 15–30% du TCO IA total, avec 70–85% dans les pipelines de données, la gouvernance, l'observabilité et la supervision humaine. Cela signifie que même des baisses de prix modestes des hyperscalers n'empêcheront pas les entreprises de basculer vers DeepSeek si l'écart de coût reste de 20–50×.

L'asymétrie informationnelle est que la plupart des investisseurs se concentrent sur la croissance des revenus IA en titre — Azure en hausse de 39% en glissement annuel, Google Cloud en hausse de 28% en glissement annuel — et ne décomposent pas cette croissance en inférence versus services de plateforme. La divulgation de Microsoft selon laquelle l'infrastructure IA exerce une pression sur les marges brutes est enfouie dans les commentaires de segment, et ni AWS ni Google Cloud ne fournissent une ventilation P&L claire pour l'infrastructure IA. L'inertie narrative est puissante : "l'IA est le prochain cloud, et les hyperscalers domineront l'IA comme ils ont dominé le cloud". Mais la différence structurelle est que l'infrastructure cloud (calcul, stockage, réseau) n'a jamais été vraiment commoditisée parce qu'elle nécessitait des investissements fixes massifs et avait de forts effets de gravité des données. L'inférence IA, en revanche, est sans état, portable et de plus en plus disponible sur des plateformes qui offrent des SLA comparables à une fraction du coût.

L'écart persiste parce que les hyperscalers croissent encore assez vite pour que les investisseurs ne s'inquiètent pas encore de la compression des marges, et parce que la courbe d'adoption de DeepSeek est encore assez précoce pour ressembler à un phénomène de niche plutôt qu'à une menace structurelle. Cela changera au S2 2026 lorsque la prochaine vague de déploiements IA d'entreprise atteindra la production et que les directeurs financiers commenceront à demander pourquoi ils paient 20–50× plus pour l'inférence qu'ils n'en ont besoin.

Où la valeur se déplace

La taille de l'opportunité dépend de la part des revenus d'infrastructure IA des hyperscalers qui est en danger et de la valeur qui se déplace vers les couches d'orchestration et de gouvernance. Le segment Intelligent Cloud de Microsoft a généré environ 96 milliards de dollars de revenus en FY25, Azure représentant la majorité ; si l'infrastructure IA représente 10–15% des revenus Azure — une estimation conservatrice compte tenu de l'accent mis par Microsoft sur la croissance IA — cela représente 10–15 milliards de dollars de revenus annuels. AWS a généré environ 105 milliards de dollars de revenus en 2024, avec une infrastructure IA probablement dans la fourchette de 15–20 milliards de dollars selon les commentaires de croissance. Google Cloud a généré environ 50 milliards de dollars en 2024, avec l'infrastructure IA et les solutions d'IA générative stimulant la croissance ; supposons 7–10 milliards de dollars de revenus liés à l'IA.

Combinés, les hyperscalers génèrent 30–45 milliards de dollars de revenus annuels d'infrastructure IA, avec des marges brutes dans la fourchette de 50–70% selon le mix d'inférence versus services de plateforme. Si les marges d'inférence se compriment de 20–30 points de pourcentage au cours des 18–24 prochains mois en raison de l'arbitrage DeepSeek et de l'adoption de modèles à poids ouverts, cela représente 6–13 milliards de dollars de bénéfice brut annuel en danger pour les trois hyperscalers.

La valeur ne disparaît pas — elle se déplace vers les couches d'orchestration, de gouvernance et d'observabilité. Le marché de l'observabilité LLM devrait passer de 1,44 milliard de dollars en 2024 à 6,8 milliards de dollars d'ici 2029, soit une augmentation de 5,4 milliards de dollars. Le marché des logiciels de gouvernance IA devrait passer d'environ 300 millions de dollars en 2025 à 5,88 milliards de dollars d'ici 2035, impliquant environ 5,5 milliards de dollars de création de valeur incrémentale au cours de la prochaine décennie. Cloudflare, Databricks, Datadog et d'autres plateformes indépendantes sont positionnées pour capter une part disproportionnée de cette croissance parce qu'elles ne sont pas liées à un seul fournisseur d'inférence et peuvent offrir une meilleure gestion des coûts et des contrôles de politique que l'outillage natif des hyperscalers.

Cloudflare a signalé une croissance de plus de 1 200% en glissement annuel des requêtes AI Gateway, indiquant que les entreprises routent les appels d'inférence via des plans de contrôle indépendants plutôt que de se verrouiller dans Azure OpenAI ou Bedrock. Des analyses indépendantes des dépenses IA d'entreprise montrent que l'inférence et l'accès aux modèles ne représentent que 15–30% du TCO IA total, avec 70–85% dans les pipelines de données, la gouvernance, l'observabilité et la supervision humaine. Cela signifie que même si les marges d'inférence se compriment à près de zéro, les hyperscalers peuvent toujours capter de la valeur — mais seulement s'ils contrôlent la plateforme environnante. Les preuves suggèrent qu'ils perdent ce contrôle.

Le problème de vélocité de déploiement

Les équipes IA déploient désormais 1 000 fois par mois, nécessitant une nouvelle infrastructure de pipeline que l'outillage natif des hyperscalers n'a pas été conçu pour gérer. Le passage des déploiements IA pilotes à la production ne concerne pas seulement le coût d'inférence — il concerne la gouvernance, l'observabilité et l'orchestration à une échelle que l'outillage DevOps traditionnel ne peut pas gérer. Microsoft incite les entreprises à migrer d'Azure Repos vers GitHub malgré le bilan de fiabilité instable de GitHub, signe que l'entreprise privilégie la consolidation de l'écosystème à la qualité de service. Microsoft a positionné Azure Foundry comme la couche de fiabilité et de gouvernance, pariant que la bataille IA d'entreprise concerne l'orchestration, pas la capacité d'inférence brute.

Mais les preuves suggèrent que les entreprises n'achètent pas l'histoire de plateforme groupée. Elles routent l'inférence via des plans de contrôle indépendants comme AI Gateway de Cloudflare, utilisent Datadog pour l'observabilité LLM, consolident les données sur MongoDB Atlas et Cortex AI de Snowflake, et diffusent des données en temps réel via les pipelines basés sur Kafka de Confluent. Les hyperscalers capturent encore une partie de cette valeur via les services de plateforme, mais le profil de marge est fondamentalement différent : les services de plateforme nécessitent un investissement R&D continu et sont en concurrence avec des outils indépendants best-of-breed, alors que l'inférence était censée être un flux de revenus à forte marge et faible contact.

Les instruments

Ce portefeuille exprime la thèse à travers trois couches structurelles : les plateformes d'orchestration et de gouvernance qui capturent de la valeur à mesure que l'inférence se commoditise, l'infrastructure de fondation de données sur laquelle les entreprises se consolident quel que soit le fournisseur d'inférence, et les bénéficiaires d'infrastructure qui gagnent si le volume d'inférence explose même si les marges se compriment.

Cloudflare (NET) est l'exposition structurelle la plus pure à la commoditisation de l'inférence. AI Gateway se situe entre les entreprises et les fournisseurs d'inférence, capturant de la valeur à mesure que le routage multi-modèles devient standard. La croissance de 1 200% en glissement annuel des requêtes AI Gateway valide le mécanisme de thèse : les entreprises ne sont plus disposées à se verrouiller dans Azure OpenAI ou Bedrock si cela signifie payer 20–50× plus pour l'inférence. La valorisation de Cloudflare intègre la perfection — 33x prix/ventes, marge opérationnelle négative — mais la couche d'orchestration est là où la marge s'accumule à mesure que l'inférence devient un intrant commoditisé. Le potentiel de hausse est de 50% à 330$ si la monétisation d'AI Gateway s'accélère au S2 2026 à mesure que les déploiements d'entreprise montent en échelle. Poids : 20%. Horizon : 540 jours.

Datadog (DDOG) est une plateforme d'observabilité leader avec des capacités de surveillance LLM ; le marché de l'observabilité LLM devrait croître de 36% annuellement pour atteindre 6,8 milliards de dollars d'ici 2029. À mesure que les entreprises routent entre DeepSeek, Claude et des modèles sur site, elles ont besoin de journalisation unifiée, de suivi des coûts et d'application de politiques — des capacités que Datadog fournit mieux que l'outillage natif des hyperscalers. La valorisation est vertigineuse — 22x ventes, 593x P/E — ne laissant aucune marge d'erreur, mais le mécanisme de thèse (dépenses de gouvernance augmentant à mesure que l'inférence se commoditise) est direct. Le potentiel de hausse est de 50% à 340$ si les dépenses d'observabilité LLM évoluent avec la complexité de déploiement multi-modèles. Poids : 15%. Horizon : 540 jours.

Elastic (ESTC) fournit la recherche, l'observabilité et l'analyse de sécurité qui correspondent à la couche de gouvernance et de surveillance IA. Elasticsearch est le standard de facto pour l'agrégation de logs ; positionné dans l'observabilité IA sans exposition aux marges des hyperscalers. La valorisation est peu exigeante — 17x bénéfices pour 17% de croissance, rendement FCF de 5,1% — et l'entreprise bénéficie structurellement à mesure que les déploiements multi-modèles nécessitent une journalisation centralisée et une détection d'anomalies. Le potentiel de hausse est de 40% à 85$ si les dépenses d'observabilité évoluent avec la complexité de déploiement IA. Poids : 12%. Horizon : 450 jours.

MongoDB (MDB) fournit la couche de fondation de données via Atlas et la recherche vectorielle, capturant les dépenses à mesure que les entreprises construisent des systèmes IA de production quel que soit le fournisseur d'inférence. Atlas et la recherche vectorielle se situent au-dessus de la couche d'inférence — les entreprises exécutant des architectures multi-modèles ont besoin d'une base de données qui gère les données non structurées et les embeddings à l'échelle, qu'elles routent entre DeepSeek, Claude ou GPT-4. La croissance des revenus de 23% est tirée par l'entreprise, s'alignant avec la vague de déploiement du S2 2026. Le potentiel de hausse est de 25% si Atlas devient la base de données vectorielle par défaut pour l'IA de production. Poids : 15%. Horizon : 540 jours.

NVIDIA (NVDA) bénéficie structurellement à mesure que les marges d'inférence des hyperscalers se compriment et que les entreprises passent à DeepSeek auto-hébergé ou à des architectures hybrides pour échapper à la tarification Azure/AWS — elles ont toujours besoin de GPU, et la pile logicielle de NVIDIA (NIM, TensorRT-LLM, Triton) capture la valeur d'orchestration à la périphérie et dans les clouds privés. Le catalyseur de thèse est à double tranchant : plus de déploiements sur site favorisent le matériel NVIDIA, mais une intensité de calcul par token plus faible (efficacité MoE de DeepSeek) favorise moins de puces par rack. Dimensionné à 18% comme couverture contre la compression des marges cloud et comme exposition à la demande GPU sur site si le coût devient le critère de sélection dominant des entreprises. Cible : 260$. Horizon : 450 jours.

Snowflake (SNOW) se situe dans la couche de fondation de données où les entreprises se consolident avant d'exécuter des charges de travail d'inférence — les 15–25% du TCO IA que la thèse identifie comme non commoditisables. Cortex AI positionne Snowflake comme le plan de contrôle de politique et de pipeline. La valorisation suppose une expansion de marge qui ne s'est pas encore matérialisée (marge opérationnelle négative de -26%, 16,5x ventes) et la position concurrentielle contre Databricks et les bundles d'hyperscalers est contestée. Dimensionné à 10% pour refléter l'alignement de thèse (dépenses de gouvernance augmentant à mesure que l'inférence se commoditise) mais capture non prouvée de ces dépenses aux taux de combustion actuels. Horizon : 540 jours.

Confluent (CFLT) capture les dépenses d'infrastructure de streaming de données à mesure que les entreprises construisent des pipelines IA en temps réel ; la fondation de données représente 15–25% du TCO IA. Le streaming de données basé sur Kafka pour les pipelines en temps réel est la plomberie de données pour les architectures IA multi-modèles. À mesure que les entreprises routent l'inférence entre DeepSeek, Anthropic et des modèles open source, elles ont besoin de streaming de données en temps réel pour alimenter ces modèles et orchestrer les sorties. La valorisation intègre déjà l'histoire de croissance (9,5x P/S, FCF négatif) et l'entreprise est toujours non rentable. Dimensionné à 10% comme exposition à l'infrastructure de données IA multi-modèles avec un potentiel de hausse de 30–40% à 40$ si les dépenses de données IA s'accélèrent. Horizon : 450 jours.

Hypothèses et falsification

DeepSeek et d'autres fournisseurs d'inférence à faible coût montent en échelle vers des volumes de production d'entreprise avec des SLA de disponibilité de 99,9%+ d'ici le S2 2026. Falsifié si : DeepSeek ou les wrappers tiers (Together AI, Atlas Cloud, Lightning AI Hub) subissent des pannes prolongées ou ne parviennent pas à respecter les seuils de fiabilité d'entreprise, amenant les entreprises averses au risque à payer la prime hyperscaler pour Azure OpenAI ou Anthropic hébergé sur Bedrock.
L'inférence représente 30–50% des revenus d'infrastructure IA des hyperscalers, avec des marges brutes dans la fourchette de 50–70%. Falsifié si : Les hyperscalers divulguent que l'inférence représente <20% des revenus IA ou que les services de plateforme (Foundry, outillage Bedrock, Azure ML) capturent déjà la majorité de la marge, réduisant l'ampleur de la compression.
Les entreprises redirigent 20–40% des économies de coûts d'inférence vers l'outillage de gouvernance, d'observabilité et d'orchestration d'ici 2027. Falsifié si : Les entreprises empochent les économies plutôt que de réinvestir, ou si les hyperscalers regroupent avec succès l'outillage de gouvernance à coût marginal zéro (par exemple, Azure Foundry devient gratuit, AWS lance une couche de gouvernance Bedrock qui est "suffisamment bonne"), empêchant les plateformes indépendantes de capter le déplacement de valeur.
Les hyperscalers ne peuvent pas défendre la tarification d'inférence par le verrouillage de l'écosystème ou une fiabilité supérieure. Falsifié si : Microsoft verrouille avec succès les entreprises dans Azure Foundry avec des coûts de changement suffisamment élevés pour justifier la prime d'inférence de 20–50×, ou si AWS construit une couche de gouvernance significativement meilleure que Cloudflare/Databricks, gardant les entreprises sur Bedrock malgré l'écart de coût.
La vague de déploiements IA d'entreprise du S2 2026 privilégie le coût à la capacité comme critère de sélection dominant. Falsifié si : Les entreprises retardent les déploiements de production en raison de conditions économiques ou d'incertitude réglementaire, repoussant le catalyseur de 12–18 mois, ou si la capacité (qualité du modèle, latence, fenêtre de contexte) reste le facteur de décision principal et que les entreprises acceptent la prime hyperscaler pour des avantages de performance perçus.

Risques

Les baisses de prix des hyperscalers pourraient réduire l'écart de coût si Azure, AWS et GCP réduisent agressivement la tarification d'inférence (réductions de 50–70%) pour défendre leur part de marché. Les entreprises peuvent percevoir les hyperscalers comme "suffisamment bon marché", retardant le passage à DeepSeek et réduisant l'urgence pour les plateformes de gouvernance indépendantes. Cela comprime les marges des hyperscalers plus rapidement que la thèse ne le prédit mais retarde également le déplacement de valeur vers les couches d'orchestration.

Le regroupement et la concurrence à coût marginal zéro est le risque du "suffisamment bon". Les hyperscalers pourraient regrouper l'outillage de gouvernance, d'observabilité et d'orchestration dans leurs plateformes sans coût incrémental (par exemple, Azure Foundry devient gratuit, AWS lance Bedrock Policy Manager), rendant économiquement irrationnel pour les entreprises de payer Cloudflare, Datadog ou Databricks pour un outillage autonome. La version hyperscaler n'a pas besoin d'être best-in-class, juste suffisante pour empêcher la défection.

Fiabilité de DeepSeek et risque géopolitique : DeepSeek est un fournisseur de modèles chinois ; si les tensions géopolitiques s'intensifient ou si les entreprises américaines font face à une pression réglementaire pour éviter l'infrastructure IA chinoise, l'adoption stagne quels que soient les avantages de coût. Les wrappers tiers (Together AI, Atlas Cloud) atténuent cela en hébergeant DeepSeek dans des centres de données américains, mais le risque demeure si l'architecture de modèle sous-jacente est perçue comme une vulnérabilité de la chaîne d'approvisionnement.

Compression de valorisation dans les jeux de gouvernance à multiple élevé : Cloudflare (33x P/S), Datadog (22x P/S) et Snowflake (16,5x P/S) sont valorisés pour une hypercroissance soutenue. Si l'adoption d'AI Gateway ou de l'observabilité LLM est plus lente que prévu, ou si les entreprises manquent les guidances trimestrielles, les multiples se compriment de 30–50% indépendamment de la validité de la thèse à long terme. C'est un risque d'exécution, pas un risque de thèse, mais cela crée une volatilité à court terme.

Destruction de la demande NVIDIA par l'efficacité MoE : l'architecture Mixture-of-Experts de DeepSeek n'active que 37B de 671B paramètres par token, réduisant l'utilisation GPU par charge de travail d'inférence. Si ce gain d'efficacité se propage dans l'industrie (OpenAI, Anthropic adoptent des architectures similaires), la demande totale de GPU par rack diminue même si le volume d'inférence explose, exerçant une pression sur la croissance des ventes unitaires de NVIDIA. Le taux d'attachement logiciel de l'entreprise (NIM, Triton) peut ne pas compenser le vent contraire matériel.

Risque de trade surpeuplé dans les shorts d'infrastructure IA : si la thèse devient consensuelle (par exemple, plusieurs hedge funds shortent les marges des hyperscalers ou sous-pondèrent MSFT/GOOGL/AMZN en faveur de jeux de gouvernance), toute surprise positive (défense de tarification des hyperscalers, panne DeepSeek, pause des dépenses IA d'entreprise) déclenche un dénouement violent. Ce portefeuille est long uniquement, mais les longs de gouvernance (NET, DDOG, ESTC) sont corrélés et pourraient se vendre ensemble si le narratif change.

Portefeuille

Ticker	Poids	Cible	Horizon
NET	20%	330$	540j
DDOG	15%	340$	540j
ESTC	12%	85$	450j
MDB	15%	—	540j
NVDA	18%	260$	450j
SNOW	10%	—	540j
CFLT	10%	40$	450j

Sources

1.The New Stack — Microsoft just made the agent runtime free — and kept everything around it
2.The New Stack — AI teams now deploy 1,000 times a month. Your pipeline wasn’t built for that.
3.The New Stack — With Foundry, Microsoft bets the enterprise AI battle is about reliability, not capability
4.The New Stack — Why Anthropic just doubled Claude Cowork limits at no charge
5.The New Stack — Microsoft’s pitch to enterprises: Ditch Azure Repos for GitHub, despite its rocky reliability record
6.The New Stack — This AI agent startup ditched Anthropic for DeepSeek’s — and says it’s saving millions
7.The New Stack — Anthropic launches Claude Mythos/Fable 5, but you better try it soon

performance since publication

-1.06%

counterfactual (pre-publication)actual (since publication)

Portfolio

ticker	kind	wgt	entry
NET	stock	20%	219.59
DDOG	stock	15%	227.63
ESTC	stock	12%	60.78
MDB	stock	15%	348.28
NVDA	stock	18%	200.42
SNOW	stock	10%	239.90
CFLT	stock	10%	30.99