Eu vou ser direto: a maioria das software houses que acompanho está gastando entre 50% e 70% mais tokens do que precisaria no Claude Code.
Não é exagero. É o que os números mostram. Uma sessão de code review que deveria consumir 18 mil tokens está comendo 38 mil. Uma análise de arquitetura que poderia rodar com 22 mil tokens está queimando 45 mil. E o pior: seus devs nem sabem que isso está acontecendo.
Até agora, o único jeito de descobrir era rodar /cost e ver um número bruto de tokens consumidos — sem contexto, sem explicação, sem sugestão do que fazer. Isso mudou com o /context, um comando que chegou na versão 2.1.74 do Claude Code e que, na minha opinião, deveria ser o primeiro comando que todo dev aprende depois do /help.
O que é o /context
O comando /context faz algo que parece simples mas muda completamente como você usa o Claude Code: ele exibe um grid visual colorido mostrando em tempo real como está o consumo da sua janela de contexto.
Mas não é só um gráfico bonito. O /context analisa sua sessão e entrega sugestões acionáveis de otimização. Ele identifica três coisas:
- Ferramentas pesadas — quais tools estão consumindo mais contexto (aquele
WebFetchque trouxe uma página inteira, aqueleReadque leu um arquivo de 2 mil linhas) - Memory bloat — quando suas memórias (CLAUDE.md, auto-memory) estão inchadas e comendo contexto desnecessário
- Avisos de capacidade — quando você está chegando perto do limite e precisa compactar ou limpar
Antes do /context, você voava no escuro. Agora é como ter um dashboard de consumo de combustível no painel do carro.
Para usar, basta digitar na sua sessão:
/context
O comando retorna o grid visual imediatamente, sem custo adicional de tokens.
Como funciona na prática
Imagine o seguinte cenário: seu dev está debugando um problema há 40 minutos. Já leu 15 arquivos, rodou 8 comandos bash, fez 3 buscas com grep. A sessão está pesada, as respostas estão mais lentas, e ele não sabe por quê.
Ele digita /context. O grid aparece. Os blocos vermelhos mostram que dois Read de arquivos enormes estão comendo 40% do contexto. As sugestões recomendam: “Considere usar /compact para comprimir o histórico” e “Ferramentas Read consumindo 35% do contexto — considere ler apenas as linhas relevantes com offset/limit”.
Com essas informações, o dev compacta a sessão, e a próxima resposta do Claude vem 2.3 segundos mais rápido. Não é magia — é o que acontece quando você baixa o uso de contexto de 95% para 85% da capacidade.
O /context complementa o /cost (que mostra tokens consumidos) com informação visual e acionável. Um mostra quanto você gastou. O outro mostra por que você gastou e o que fazer para gastar menos.
Por que isso importa para sua Software House
Vou colocar em números que todo CEO de SH entende.
O custo por desenvolvedor usando Claude Code via API fica entre US$ 100 e US$ 200 por mês com Sonnet. No dia a dia, a média é de US$ 6 por dev, com o percentil 90 chegando a US$ 12. Se você tem uma equipe de 10 devs, estamos falando de US$ 1.000 a US$ 2.000 por mês só em tokens.
Agora, pesquisas recentes mostram que aplicar três técnicas de otimização — Plan Mode, sessões focadas e prompts estruturados — reduz o consumo em 60% ao longo de um dia de trabalho. Isso é US$ 600 a US$ 1.200 por mês que voltam para o seu caixa.
O /context é a ferramenta que torna essas otimizações visíveis. Sem ele, otimizar contexto é como fazer dieta sem balança — você até tenta, mas não tem feedback.
Os números que você precisa conhecer
| Técnica | Economia de tokens |
|---|---|
| Plan Mode (Shift+Tab) | 53% menos tokens |
| Sessões focadas (em vez de uma sessão longa) | 60% menos por sessão |
| .claudeignore configurado | 25% menos em leitura de arquivos |
| Prompts estruturados | 30% menos que prompts narrativos |
| Compactar a 85% (em vez de 95%) | 2.3s mais rápido por resposta |
Resultado combinado: 40% de boost em produtividade.
E tem um dado que me assusta. Um estudo com mais de 10 mil desenvolvedores revelou que equipes com uso intenso de IA completam 21% mais tarefas, mas têm 91% mais tempo de review de PR. Ou seja: mais código não significa automaticamente mais valor. A qualidade de como você usa a IA importa mais que a quantidade.
O /context ataca exatamente isso. Não é sobre usar mais Claude Code. É sobre usar melhor.
As 5 otimizações que o /context vai te ajudar a implementar
Baseado no que o /context diagnostica, estas são as ações mais impactantes:
1. Compacte antes de saturar
Não espere o Claude ficar lento. Quando o /context mostrar blocos amarelos (70-85% de uso), rode /compact com instruções do que preservar. Sessões de 180 mil tokens respondem em 8.2 segundos. Três sessões focadas de 40 mil respondem em 2.1 segundos — quase 4x mais rápido.
2. Use Plan Mode para tarefas de análise
Shift+Tab ativa o Plan Mode, que corta consumo pela metade. Uma análise de arquitetura cai de 45 mil para 22 mil tokens. O Claude pensa mais e executa menos — que é exatamente o que você quer na fase de planejamento.
3. Configure seu .claudeignore
Se o /context mostrar que Read está consumindo muito, provavelmente seus devs estão lendo node_modules, dist, ou arquivos de build. Um .claudeignore bem configurado corta 25% do consumo de leitura em projetos Node.js.
4. Quebre sessões longas em sessões focadas
Uma sessão de 3 horas com 180 mil tokens tem 72% de relevância nas respostas. Três sessões de 1 hora com 40 mil tokens cada têm 94% de relevância. O /context te mostra quando é hora de rodar /clear e começar uma sessão nova.
5. Estruture seus prompts
“Analise o arquivo X, foque nas linhas 100-200, busque problemas de performance no loop principal” consome 30% menos tokens que “dá uma olhada nesse arquivo e me diz o que acha”. O /context revela o impacto dessas escolhas em tempo real.
O que eu penso
Na minha experiência com 300+ software houses, o padrão que mais vejo é: o CEO compra o plano, distribui pra equipe, e ninguém monitora como está sendo usado. Três meses depois, a conta está alta e ninguém sabe explicar por quê.
O /context muda esse jogo. Pela primeira vez, cada desenvolvedor tem visibilidade instantânea de como está usando o recurso. É como dar um dashboard de performance individual para cada membro da equipe — mas em vez de métricas abstratas, são tokens e dinheiro.
Se você está começando a adotar Claude Code na sua SH, coloque isso no seu CLAUDE.md de onboarding: “Antes de qualquer sessão longa, rode /context“. Esse simples hábito pode ser a diferença entre um investimento que se paga e uma despesa que só cresce.
Se você curtiu esse tema, leia também o artigo sobre MCP Elicitation: O Claude Agora Conversa Com Suas Ferramentas — outra feature que mudou o jogo para software houses que usam Claude Code.
Conclusão
O /context não é a feature mais chamativa do Claude Code. Não tem a magia dos Agent Teams ou a conveniência do Voice Dictation. Mas pode ser a feature que mais economiza dinheiro para sua software house.
Um grid colorido, sugestões acionáveis, e a visibilidade que faltava para otimizar o uso de IA na sua equipe. Disponível desde a versão 2.1.74 — basta digitar /context na sua próxima sessão.
Se você quer implementar esse nível de gestão de IA na sua software house, comece pelo básico: monitore, otimize, e repita. A tecnologia está aí. O que falta é a disciplina de usar bem.
Sou Thulio, mentoro 300+ SHs desde 2016.
Referências: