mispricing · technology

Затраты на AI-токены видны, ценность AI-вывода — нет. Лонг инструменты управления, шорт гиперскейлеры

published 6/4/2026

4 марта 2026 года средняя по размеру компания тихо внесла поправку в контракт на закупку AI-сервисов. Поправка добавила пункт, требующий ежеквартальной атрибуции ROI для всех расходов на LLM-токены. Пункт заставит поставщика — гиперскейлера, чьё имя компания не раскрывает, — инструментировать каждый промпт, трассировать каждый ответ и связывать потребление токенов с измеримыми бизнес-результатами. Гиперскейлер не может этого сделать. Его платформа выставляет счета за обработанные токены, а не за доставленную ценность. Компания теперь оценивает сторонние инструменты наблюдаемости, чтобы сделать работу, которую гиперскейлер делать не будет. Это не крайний случай. Это передний край структурного сдвига, который рынок ещё не оценил.

Корпоративные расходы на AI выросли с $11,5 млрд в 2024 году до $37 млрд в 2025-м — рост в 3,2 раза за один год. Опросы показывают, что 72% организаций ожидают дальнейшего роста расходов на LLM в 2025 году, причём некоторые компании сообщают, что AI потребляет до половины IT-бюджетов. При этом 80–85% предприятий промахиваются с прогнозами AI-инфраструктуры более чем на 25% из-за слабого управления затратами, и большинство не может связать расходы с конкретными, измеримыми бизнес-результатами. Проблема структурная: затраты AI — токены, вычисления, ватты — немедленно видны и поддаются аудиту. Экономическая ценность AI-вывода остаётся непрозрачной. SemiAnalysis называет это «Тёмным Выводом» (Dark Output) — работой, которую AI выполняет, но которую национальные счета не видят, а предприятия не могут измерить. Будущий председатель ФРС Кевин Уорш признал в декабре 2025 года, что «если вы смотрите на данные, по моему мнению, вы смотрите назад. Вы опоздаете. Вы не осознаете, что страна способна на неинфляционный рост быстрее».

Рынок оценивает рост AI-выручки гиперскейлеров как устойчивый и маржинальный. AI-сервисы Azure обеспечили 12–16 процентных пунктов роста в FY25. Выручка AWS выросла на 19% в Q4 2024 при ускорении за счёт AI-нагрузок. Google Cloud вырос на 48% к Q4 2025, Gemini обрабатывал 10 млрд токенов в минуту. Разрыв: консенсус не оценивает риск того, что предприятия рационализируют расходы на токены, как только поймут, что не могут измерить ценность вывода. Опросы CFO показывают, что оптимизация затрат входит в топ-приоритеты на 2025–2026 годы, и хотя AI-бюджеты сейчас защищены, эта защита становится иррациональной в момент, когда финансовые руководители осознают, что финансируют центр затрат без атрибуции. Сценарий cloud FinOps 2015–2020 годов даёт шаблон — предприятия потребуют видимости, управления и контроля затрат, сжимая маржу гиперскейлеров и ускоряя принятие инструментов наблюдаемости.

Проблема измерения не нова — но AI делает её структурной

Компьютерная революция 1990-х создала проблему измерения производительности, на решение которой ушло десятилетие. Замечание Роберта Солоу — «Компьютерную эпоху видно везде, кроме статистики производительности» — отразило разрыв между видимым внедрением технологий и невидимым экономическим выводом. Пересмотр методологии 2013 года добавил инвестиции в R&D и интеллектуальную собственность в учёт ВВП, ретроактивно увеличив производство 1990-х примерно на $3,6 трлн — почти 30% полного ВВП 2000 года. Пересмотр был равномерно распределён по годам, так что темпы роста в официальных счетах почти не изменились, но масштаб коррекции показал, насколько сильно национальная статистика отставала от реальной экономической трансформации.

AI создаёт ту же проблему измерения, но быстрее и с критическим отличием. Разрыв производительности 1990-х был невидим для всех — предприятий, правительств, статистиков. Разрыв AI асимметричен. Затраты видны в реальном времени. Гиперскейлеры выставляют счета за обработанные токены и потреблённые GPU-часы. Это чистые, поддающиеся аудиту статьи, которые немедленно появляются в балансах. То, что предприятия получают взамен — вывод этих токенов, — не имеет стандартной единицы измерения. Тысяча токенов может составить email, сгенерировать фрагмент кода, резюмировать контракт или выдать галлюцинацию. Стоимость одинакова. Ценность непознаваема без контекста, оценки и интеграции в рабочий процесс.

Эта асимметрия не бухгалтерская причуда. Это структурная особенность того, как AI-нагрузки оцениваются и потребляются. У гиперскейлеров нет стимула делать ценность вывода видимой — это обнажило бы факт, что большая часть расходов на токены производит маргинальную или нулевую инкрементальную бизнес-ценность. The New Stack сообщил в начале 2026 года, что GPT-5.4, Claude и Gemini не могут согласовать базовые, реальные факты. Если фронтирные модели расходятся в истине, как предприятие измеряет ROI работы по резюмированию контракта на миллион токенов? Ответ: никак, если оно не инструментирует рабочий процесс, не оценивает вывод и не связывает потребление токенов с измеримым бизнес-результатом. Гиперскейлеры не предоставляют эту инструментацию. Сторонние инструменты наблюдаемости предоставляют.

Сценарий cloud FinOps повторяется — сжато

Сценарий оптимизации облачных затрат 2015–2020 годов даёт шаблон. Ранние пользователи облака, такие как Adobe и Intuit, создали внутренние практики для финансовой подотчётности облачных расходов в начале 2010-х, в основном как кастомные усилия, а не именованную дисциплину. К середине 2010-х глобальные предприятия столкнулись с той же базовой проблемой: управление облачными затратами в масштабе по мере перехода нагрузок от пилотов к продакшену. FinOps Foundation был создан в 2019 году для обеспечения сообщества, общего словаря и фреймворка лучших практик. К 2020 году у Foundation было всего 12 корпоративных членов и сообщество из нескольких тысяч практиков, что указывало на то, что FinOps всё ещё находился на стадии ранних последователей. После 2020 года принятие резко ускорилось — рост с 12 корпоративных членов в 2020 году до более 175 к 2024-му.

Период 2015–2020 годов был формирующей фазой с высоким обучением. Управление AI-затратами сейчас входит в ту же фазу, но сжато. Разница: облачные затраты были хотя бы привязаны к видимой инфраструктуре — серверам, хранилищу, пропускной способности. Предприятия могли видеть, за что платят, даже если не могли это контролировать. AI-затраты привязаны к невидимому выводу. The New Stack сообщил, что наблюдаемость AI-затрат возникла как категория сторожевого пса, а ценообразование и модели потребления на основе токенов стали одной из самых быстрорастущих статей расходов в корпоративных технологических бюджетах. Недавние исследования управления сообщают, что около 80–85% предприятий промахиваются с прогнозами AI-инфраструктуры более чем на 25%, в основном из-за слабого управления затратами и недооценки роста использования. «Теневой AI» (Shadow AI) — команды, списывающие AI-инструменты вне центрального IT/финансов, — ускоряет как расходы, так и риски, создавая дублирующие инструменты, пробелы в безопасности и незапланированные AI-премии на существующий SaaS.

Катализатор виден. Опросы CFO показывают оптимизацию затрат как топ-приоритет на 2025–2026 годы, причём более половины ставят «оптимизацию затрат в масштабе предприятия» в свои главные фокусы. Несмотря на это, анализ показывает, что хотя около двух третей CFO сокращали затраты в середине 2025 года, они в целом защищали бюджеты на AI и автоматизацию, причём некоторые описывали AI как «последнее, что нужно резать». Эта защита рациональна — если AI стратегичен. Она становится иррациональной в момент, когда CFO осознают, что финансируют центр затрат без атрибуции ROI. Сценарий FinOps показывает, что происходит дальше: предприятия требуют видимости, управления и контроля затрат. Облачные расходы не прекратили расти после появления FinOps, но они прекратили расти неконтролируемо. Зарезервированные инстансы, планы экономии, правильный размер и возвратные платежи стали стандартом. Рост выручки гиперскейлеров замедлился. Маржа сжалась. Та же динамика сейчас формируется для AI.

Рост выручки гиперскейлеров материален, но маржа под риском

Экспозиция гиперскейлеров к AI-выручке уже материальна, но ещё не доминирует. Выручка AWS составила $28,8 млрд в Q4 2024, рост 19% год к году, при этом AI-нагрузки, вероятно, представляют высокие однозначные — низкие двузначные проценты выручки, но гораздо более высокую долю инкрементального роста. Если AI-сервисы обеспечили примерно половину инкрементального роста выручки, это подразумевает примерно $2–4 млрд квартальной AI-выручки в AWS к концу 2024 года. Выручка Intelligent Cloud Azure составила $25,5 млрд в Q4 2024, при этом AI уже обеспечивал очень большую долю роста, даже если ещё не большинство абсолютной выручки. Google Cloud составил $12 млрд в Q4 2024, доля AI меньше, чем в 2025-м, но уже материальна. К Q4 2025 Google Cloud рос на 48% с run-rate $70+ млрд, а выручка gen-AI продуктов выросла почти на 400% год к году.

Проблема: объёмы токенов взрывообразно растут, а удельные затраты рушатся. Google раскрыл, что затраты на обслуживание Gemini упали на 78% за 2025 год, что подразумевает примерно в 4,5 раза больше токенов на GPU-час. К Q1 2026 Gemini обрабатывал 16 млрд токенов в минуту. Это запускает гонку на дно в затратах на инференс, при этом рост выручки подпитывается объёмом, умноженным на слегка более низкую цену за токен, а не повышением цен. Маржа зависит от того, успевают ли прирост эффективности за снижением цен. Если предприятия рационализируют расходы на токены — принимая зарезервированные мощности, инструменты управления или миграцию нагрузок на более дешёвые слои инференса, — рост выручки гиперскейлеров сталкивается со структурным встречным ветром. Рынок оценивает этот рост как устойчивый. Это не так.

Структурная причина, по которой рынок это не оценил: стандарты измерения AI-вывода ещё не существуют. Предприятия сегодня используют смешанный подход — стандартизированные фреймворки оценки качества AI-вывода (бенчмарки, LLM-as-a-judge, человеческая оценка) и связывают эти метрики с бизнес-ROI через данные наблюдаемости, базовые линии и финансовые модели. Единого глобального стандарта всё ещё нет, но 2024–2025 годы показали сильное движение к общим паттернам, инструментам и де-факто метрикам в оценке LLM и наблюдаемости MLOps. Современные фреймворки качества LLM декомпозируют «качество» на измерения — корректность/обоснованность, релевантность, полноту, безопасность, стиль/UX, латентность, робастность — и связывают их с бизнес-воздействием. Проблема: эти фреймворки ещё не встроены в закупки, бюджетирование или финансовую отчётность. Пока они не встроены, CFO будут продолжать финансировать расходы на токены без атрибуции ROI. Как только они встроятся, рост выручки гиперскейлеров столкнётся со структурным встречным ветром.

Интеграция в рабочие процессы происходит — измерение ROI нет

Интеграция в корпоративные рабочие процессы реальна. The New Stack сообщил, что новая интеграция Cursor с Jira — «5 звёзд, без замечаний», сигнализируя о принятии корпоративных рабочих процессов. Cursor конкурирует напрямую с GitHub Copilot, Tabnine, Windsurf, Amazon Q Developer и Replit за корпоративное AI-кодирование, с ценообразованием примерно в той же полосе, но разными компромиссами по использованию и управлению. GitHub Copilot достиг около 20 млн накопленных пользователей и более 1,3 млн платных подписчиков к середине 2025 года, с развёртыванием примерно в 90% компаний Fortune 100. Анализы рыночной доли ставят Copilot примерно на 42% рынка платных AI-инструментов кодирования к 2025 году, при этом Cursor возникает как ближайший конкурент с примерно 18% рыночной доли и более $500 млн годовой рекуррентной выручки.

Тренд интеграции в рабочие процессы реален. Измерение ROI — нет. The New Stack сообщил, что ловушка DIY-платформ выжигает инженерные команды, при этом сложность автоматизации растёт, поскольку команды строят кастомные AI-рабочие процессы поверх Jira, Linear, GitHub и внутренних инструментов. Эти рабочие процессы потребляют токены с непредсказуемыми темпами, и большинство организаций не имеют инструментации для связи расходов на токены с результатами рабочих процессов. Также всплывают риски IP и лицензирования. The New Stack сообщил, что разработчик Гавриэль Коэн нашёл свой собственный код внутри OpenClaw и ушёл. Если происхождение обучающих данных непрозрачно, а владение выводом оспаривается, предприятия сталкиваются с юридическими и репутационными рисками поверх неконтролируемых расходов.

Структурный разрыв: предприятия интегрируют AI в рабочие процессы быстрее, чем инструментируют эти рабочие процессы для измерения затрат и качества. Это создаёт окно, где расходы на токены растут бесконтрольно, а ценность вывода остаётся неизмеренной. Окно закрывается, когда CFO требуют атрибуции. Компании, которые предоставляют инструментацию — наблюдаемость, управление, идентичность и инструменты безопасности, — захватывают инкрементальный бюджет. Компании, которые предоставляют токены — гиперскейлеры, — сталкиваются со сжатием маржи.

Портфель — лонг инструменты управления, шорт гиперскейлеры (по умолчанию)

Этот портфель выражает тезис через три структурных слоя: (1) инструменты AI-наблюдаемости и атрибуции затрат, которые делают расходы на токены и ценность вывода видимыми (Datadog, Elastic); (2) платформы AI-управления и интеграции рабочих процессов, которые связывают потребление AI с измеримыми бизнес-результатами (Palantir, Snowflake); (3) инфраструктура идентичности и безопасности, которая контролирует доступ к AI и обеспечивает политику (Okta, Palo Alto Networks, CrowdStrike); и (4) альтернативные слои инференса и данных, которые позволяют предприятиям снизить зависимость от токенов гиперскейлеров (Cloudflare, MongoDB). Портфель только лонг по дизайну. Медвежий взгляд на гиперскейлеры выражается неимением их и владением слоем инструментов, который захватывает ценность, когда предприятия рационализируют расходы на токены.

Datadog (DDOG) · 18% · таргет $325 · 180 дней. Продукт LLM Observability Datadog инструментирует промпты, трассирует использование токенов, выводит метрики оценки и связывает AI-расходы с бизнес-KPI — именно тот рабочий процесс, который тезис предсказывает, что предприятия потребуют. Платформа компании уже мониторит облачную инфраструктуру, приложения и безопасность; LLM-наблюдаемость расширяет это на AI-нагрузки. Datadog — самое чистое публичное выражение управления AI-затратами, но оценка не оставляет места для ошибок исполнения. При 651x P/E и 22,17x P/B акция оценивает безупречное исполнение и ускоряющееся принятие. Размер 18% отражает высокую убеждённость, смягчённую риском оценки.

Palantir (PLTR) · 15% · таргет $425 · 180 дней. AIP (Artificial Intelligence Platform) Palantir — это тезис в форме тикера — он явно связывает расходы на AI-токены с операционными KPI и делает AI Dark Output видимым и измеримым. Всё ускорение выручки AIP в 2025 году (56% год к году) обусловлено принятием предприятиями для рационализации AI-расходов и доказательства ROI. Платформа интегрируется с существующими корпоративными рабочими процессами (ERP, CRM, цепочка поставок) и выводит AI-генерируемые инсайты, связанные с конкретными бизнес-результатами. Оценка при 149x P/E и 40,29x P/B оценивает безупречное исполнение, поэтому размер 15%, а не 20%, чтобы ограничить риск одного имени.

Cloudflare (NET) · 15% · таргет $350 · 270 дней. Workers AI Cloudflare — самая чистая структурная экспозиция к миграции инференс-нагрузок от гиперскейлеров. Запуск инференса на edge снижает латентность и затраты на токены одновременно, сдвигая модель выручки с посимвольного биллинга на фиксированные вычисления. Если предприятия рационализируют расходы на токены, мигрируя нагрузки на более дешёвые слои инференса, Cloudflare захватывает эту миграцию. Оценка при 61,32x P/B венчурная, оценивающая быстрое принятие и расширение маржи. Размер 15% отражает высокую структурную чувствительность, смягчённую риском исполнения.

CrowdStrike (CRWD) · 12% · таргет $950 · 180 дней. Платформа Falcon CrowdStrike и инвестиция в Vanta позиционируют его на пересечении AI-безопасности, управления и соответствия. По мере распространения AI-нагрузок слои безопасности и идентичности становятся узким местом, где предприятия обеспечивают политику и измеряют риск. Стек наблюдаемости, идентичности и соответствия CrowdStrike напрямую поддерживает сдвиг от неограниченных AI-расходов к управляемым, ROI-ориентированным AI-бюджетам. Оценка при 42,64x P/B предполагает, что тезис реализуется, поэтому размер 12% отражает чистую структурную экспозицию с ограниченным апсайдом, если принятие просто соответствует ожиданиям.

Elastic (ESTC) · 10% · таргет $85 · 270 дней. Стек наблюдаемости Elastic становится субстратом для атрибуции AI-затрат — предприятия используют его для трассировки расходов на токены, вызовов моделей и латентности через LLM-нагрузки. Возможности платформы по поиску и аналитике в реальном времени делают её основой для дашбордов AI FinOps. Оценка при 18,17x P/E и 5,24x P/B нетребовательна относительно пиров, но конкурентное давление от Datadog ограничивает апсайд. Размер 10% как value-плей на AI-наблюдаемость с ограниченным апсайдом.

Snowflake (SNOW) · 10% · таргет $310 · 360 дней. Cortex AI и слой управления данными Snowflake позиционируют его как инфраструктуру для наблюдаемости AI-затрат — систему записи для расходов на токены и атрибуции ROI. Если затраты на токены становятся новыми затратами на труд, требующими гранулярного отслеживания, платформа данных Snowflake становится обязательной инфраструктурой. Оценка при 42,96x P/B сигнализирует премиальное ценообразование и риск вторжения гиперскейлеров. Размер 10% отражает выравнивание тезиса с риском исполнения и конкуренции.

Okta (OKTA) · 8% · таргет $155 · 360 дней. Okta — публичный прокси для инфраструктуры AI-управления — управление идентичностью и доступом (IAM) становится плоскостью управления для отслеживания того, какие пользователи, команды и приложения потребляют какие модели по какой стоимости на место. Кейс AI-управления остаётся имплицитным, а не доказанным в финансах, создавая асимметричный апсайд, если тезис материализуется, но даунсайд, если принятие отстаёт. Размер 8% отражает структурное соответствие с неопределённостью продуктовой дорожной карты.

Palo Alto Networks (PANW) · 8% · таргет $350 · 360 дней. Prisma Cloud и Cortex XSIAM Palo Alto Networks адресуют AI-управление и инструменты идентичности, позиционируя компанию как слой управления между предприятиями и AI-сервисами гиперскейлеров. Оценка при 242,56x P/E и 7,39x P/B уже оценивает этот исход, делая это консенсусом, а не контрарианством. Размер 8% как качественное имя, оценённое для совершенства.

MongoDB (MDB) · 4% · таргет $450 · 360 дней. Atlas vector search и операционная база данных MongoDB находятся на слое, где предприятия консолидируют фрагментированные данные для снижения раздувания промптов и потерь токенов. Компания ещё не доказала, что vector search обеспечивает инкрементальное потребление Atlas в масштабе, а оценка при 10,08x P/B уже оценивает AI-попутные ветры. Размер 4% как маргинальная экспозиция к тезису рационализации слоя данных.

Инструменты

ТикерВесТаргетГоризонт
DDOG18%$325180д
PLTR15%$425180д
NET15%$350270д
CRWD12%$950180д
ESTC10%$85270д
SNOW10%$310360д
OKTA8%$155360д
PANW8%$350360д
MDB4%$450360д

Допущения и фальсификация

  1. Предприятия потребуют измеримый ROI для AI-расходов в течение 12–18 месяцев, когда CFO осознают, что затраты на токены растут быстрее, чем атрибутируемые бизнес-результаты. Фальсифицируется, если: корпоративные AI-бюджеты продолжают расти неограниченно до 2027 года без принятия инструментов управления затратами, или если опросы CFO показывают, что AI остаётся «последним, что нужно резать», независимо от видимости ROI.

  2. Стандарты измерения AI-вывода возникнут и станут встроенными в корпоративные закупки и финансовую отчётность к 2027–2028 годам, следуя кривой принятия cloud FinOps 2015–2020 годов. Фальсифицируется, если: никакие консенсусные фреймворки оценки или стандарты наблюдаемости не получат тракцию к концу 2026 года, или если предприятия продолжают закупать AI-сервисы без пунктов атрибуции ROI в контрактах.

  3. Рост AI-выручки гиперскейлеров столкнётся со сжатием маржи, когда предприятия рационализируют расходы на токены через зарезервированные мощности, инструменты управления и миграцию нагрузок на более дешёвые слои инференса. Фальсифицируется, если: AWS, Azure и Google Cloud поддерживают или расширяют маржу AI-сервисов в 2026–2027 годах, или если ценообразование токенов остаётся неэластичным к усилиям предприятий по контролю затрат.

  4. Поставщики инструментов наблюдаемости, управления и идентичности захватят инкрементальный корпоративный бюджет, когда рационализация AI-затрат станет мандатом уровня совета директоров. Фальсифицируется, если: гиперскейлеры успешно бандлят наблюдаемость и управление в свои AI-платформы по маргинальной стоимости, предотвращая получение ценовой власти поставщиками сторонних инструментов.

  5. Миграция нагрузок на edge-инференс (Cloudflare Workers AI) и on-prem альтернативы ускорится, когда предприятия будут стремиться избежать посимвольного ценообразования гиперскейлеров. Фальсифицируется, если: гравитация данных и затраты на интеграцию удерживают AI-нагрузки централизованными на инфраструктуре гиперскейлеров, или если гиперскейлеры снижают цены на токены быстрее, чем могут конкурировать edge/on-prem альтернативы.

Риски

Риск оценки. Datadog, Palantir, Cloudflare, CrowdStrike, Palo Alto Networks и Snowflake торгуются по премиальным мультипликаторам (40x+ P/S или 100x+ P/E), которые оценивают безупречное исполнение. Любой промах по прибыли, задержка продукта или конкурентное давление запускает жёсткое сжатие мультипликатора. Портфель сконцентрирован в именах, где тезис уже частично оценён.

Бандлинг гиперскейлеров. AWS, Azure и Google Cloud могли бы забандлить инструменты наблюдаемости, управления и идентичности в свои AI-платформы по маргинальной стоимости, предотвращая захват инкрементального бюджета сторонними поставщиками. Интеграция Azure Monitor и Sentinel Microsoft в Azure AI services — шаблон. Если бандлинг ускорится, тезис проваливается.

Таймлайн принятия. Если рационализация AI-затрат займёт дольше, чем предполагает аналогия FinOps 2015–2020 годов (например, 5–7 лет вместо 3–5 лет), портфель держит имена с премиальными мультипликаторами через продолжительный период неопределённости, рискуя дерейтингом до материализации тезиса.

Регуляторные и комплаенс-шоки. Если происхождение AI-вывода и риски IP/лицензирования (динамика Гавриэль Коэн / OpenClaw) эскалируют в регуляторные мандаты или коллективные иски, предприятия могут полностью приостановить принятие AI, а не ускорить принятие инструментов управления, создавая шок спроса.

Риск переполненной сделки. AI-управление и наблюдаемость — консенсусные темы к середине 2026 года. Если институциональное позиционирование уже тяжёлое в Datadog, Palantir, CrowdStrike и Cloudflare, любой макрошок или секторная ротация запускает вынужденные продажи, которые перевешивают фундаментальную поддержку.

Ликвидность и заём. Elastic и MongoDB имеют более низкие средние объёмы, чем мега-кап пиры, создавая риск проскальзывания на входе/выходе. Ни одна из позиций не является труднозаймовой, но Palantir и Cloudflare имеют повышенный короткий интерес, что может усилить волатильность.

Sources

  1. 1.SemiAnalysisAI Dark Output: The Visible Cost of Invisible Output
  2. 2.The New StackWhy GPT-5.4, Claude, and Gemini can’t agree on basic, real-world facts
  3. 3.The New StackI tested Cursor’s new Jira integration and it’s 5 stars, no notes. Here’s why.
  4. 4.The New StackThe DIY platform trap that’s burning out engineering teams
  5. 5.The New StackGavriel Cohen found his own code inside OpenClaw, so he walked away
  6. 6.The New StackThe AI cost crisis finally has a watchdog — just not the companies causing it