Скрытые нерфы Claude и за что все самом деле платите $100 ✂️

Как я недавно и писал, эпоха дешевых ИИ-агентов закончилась. Но то, как именно компании пытаются свести юнит-экономику, заслуживает отдельного места в учебниках по наглости.

Прямо сейчас на Reddit полыхает бунт. Пользователи премиальных тарифов Claude (включая топовый Max 20x за ~$200/мес) обнаружили, что их лимиты тихонько порезали прямо посреди оплаченного месяца.

Если раньше 5-часового окна хватало на плотную сессию программирования через Claude Code, то теперь пара промптов на Opus 4.6-4.7 сжирает 100% лимита за 10 минут. Техподдержка ушла в глухую оборону, кормя людей шаблонными ответами про "динамическую сложность токенизации" и "размер контекста", отказываясь переводить тикеты на живых людей и игнорируя реальную проблему.

Очевидно, что Anthropic просто не вывозит стоимость инференса агентных воркфлоу. Но вместо честного повышения цен (или хотя бы прозрачной метрики потребления), они включили A/B тестирование "удушения" юзеров. Сегодня повезло тебе, завтра твоему соседу.

А теперь — следите за руками 🤡

На фоне этой острой нехватки GPU-мощностей для тех, кто платит живые деньги, в сеть утекли данные, что Anthropic готовится выкатить Orbit — проактивного фонового ассистента.

Эта штука должна сидеть в фоне, пылесосить ваш GitHub, мессенджеры, почту и пр., чтобы "генерировать персональные инсайты". Анонс, скорее всего, состоится уже сегодня на конференции Code with Claude в Сан-Франциско.

Прикол, да? У компании физически не хватает вычислительных мощностей, чтобы обработать прямой запрос от программиста, который пытается закрыть таску и платит за это конский ценник. Но при этом они пилят фичу, которая будет 24/7 сжигать токены в фоне, читая переписки, чтобы потом вас догонять какими-то непрошенными советами.

Вот в такое счастье мы попали:
1️⃣Прогреваем разработчиков дешевым безлимитом на старте.
2️⃣ Подсаживаем всех на иглу agentic workflows.
3️⃣Молча режем всем лимит, высвободив железо под жирные интерпрайз-фичи типа Orbit.

🐲 Даже китайцы туда же. Недавно узнал, что в GLM Coding Plan в часы пиковых нагрузок запросы идут с коэффициентом x2-x3. Узнать про это можно только в каком-то тултипе на сайте. Цены везде по факту выросли в десятки раз.

Теперь нужно еще учиться использовать LLM максимально экономно, чтобы получать от них какую-то пользу.