Как я недавно и писал, эпоха дешевых ИИ-агентов закончилась. Но то, как именно компании пытаются свести юнит-экономику, заслуживает отдельного места в учебниках по наглости.
Прямо сейчас на Reddit полыхает бунт. Пользователи премиальных тарифов Claude (включая топовый Max 20x за ~$200/мес) обнаружили, что их лимиты тихонько порезали прямо посреди оплаченного месяца.
Если раньше 5-часового окна хватало на плотную сессию программирования через Claude Code, то теперь пара промптов на Opus 4.6-4.7 сжирает 100% лимита за 10 минут. Техподдержка ушла в глухую оборону, кормя людей шаблонными ответами про "динамическую сложность токенизации" и "размер контекста", отказываясь переводить тикеты на живых людей и игнорируя реальную проблему.
Очевидно, что Anthropic просто не вывозит стоимость инференса агентных воркфлоу. Но вместо честного повышения цен (или хотя бы прозрачной метрики потребления), они включили A/B тестирование "удушения" юзеров. Сегодня повезло тебе, завтра твоему соседу.
А теперь — следите за руками 🤡
На фоне этой острой нехватки GPU-мощностей для тех, кто платит живые деньги, в сеть утекли данные, что Anthropic готовится выкатить Orbit — проактивного фонового ассистента.
Эта штука должна сидеть в фоне, пылесосить ваш GitHub, мессенджеры, почту и пр., чтобы "генерировать персональные инсайты". Анонс, скорее всего, состоится уже сегодня на конференции Code with Claude в Сан-Франциско.
Прикол, да? У компании физически не хватает вычислительных мощностей, чтобы обработать прямой запрос от программиста, который пытается закрыть таску и платит за это конский ценник. Но при этом они пилят фичу, которая будет 24/7 сжигать токены в фоне, читая переписки, чтобы потом вас догонять какими-то непрошенными советами.
Вот в такое счастье мы попали:
1️⃣Прогреваем разработчиков дешевым безлимитом на старте.
2️⃣ Подсаживаем всех на иглу agentic workflows.
3️⃣Молча режем всем лимит, высвободив железо под жирные интерпрайз-фичи типа Orbit.
🐲 Даже китайцы туда же. Недавно узнал, что в GLM Coding Plan в часы пиковых нагрузок запросы идут с коэффициентом x2-x3. Узнать про это можно только в каком-то тултипе на сайте. Цены везде по факту выросли в десятки раз.
Теперь нужно еще учиться использовать LLM максимально экономно, чтобы получать от них какую-то пользу.
Комментарии
0Комментариев пока нет.
Войдите, чтобы участвовать в обсуждении.