Imagina que você comprou um carro com 300cv mas o concessionário entregou com o modo eco ativado. Você roda meses achando que “é assim mesmo”, até que uma atualização de firmware desbloqueia os 300cv sem você pedir.
Foi exatamente isso que a Anthropic fez com o Claude Code na versão 2.1.94.
Se a sua software house usa Claude Code via API, Amazon Bedrock, Google Vertex, Microsoft Foundry, ou planos Team e Enterprise, o seu time inteiro estava rodando no modo econômico — effort level medium — desde que o recurso foi lançado. Sem aviso, sem banner, sem nada. E na v2.1.94, lançada em 7 de abril de 2026, a Anthropic silenciosamente mudou o default para high.
Na minha experiência com 300+ software houses, menos de 10% dos CTOs sabem que essa configuração existe. E ela muda completamente a qualidade do que o Claude Code entrega.
O que é o Effort Level do Claude Code
O effort level é um controle que determina quantos tokens de raciocínio o Claude gasta antes de responder. Pense nele como o “tempo de reflexão” do modelo antes de escrever código, sugerir uma arquitetura ou debugar um problema.
São quatro níveis:
- Low: mínimo de raciocínio. Respostas rápidas e baratas. Ideal para tarefas triviais como classificação de texto ou lookups simples.
- Medium: raciocínio moderado. O modelo pensa o suficiente para a maioria das tarefas do dia a dia. Era o default até agora.
- High: raciocínio profundo. O modelo gasta mais tokens pensando antes de responder. Melhor para debugging complexo, refactoring, arquitetura. Agora é o novo default.
- Max: sem limite de tokens de raciocínio. O modelo pensa o quanto precisar. Disponível apenas no Opus 4.6. Mais lento e mais caro, mas máxima capacidade.
A diferença prática? Em tarefas complexas, a diferença entre medium e high pode ser de 2x a 10x mais tokens de thinking. O modelo literalmente pensa mais antes de responder.
A documentação oficial da API já dizia: “By default, Claude uses high effort, spending as many tokens as needed for excellent results.” Mas o Claude Code, a ferramenta de terminal, overridava isso para medium. Existia uma inconsistência entre a API direta e o Claude Code — e a maioria dos times nem sabia.
Como funciona na prática
Antes da v2.1.94, o fluxo era:
- Dev abre Claude Code no terminal
- Claude Code seta effort = medium automaticamente
- Dev pede para debugar um problema complexo
- Modelo pensa “moderadamente” e entrega uma resposta “ok”
- Dev acha que “é o máximo que o Claude faz”
Depois da v2.1.94:
- Dev abre Claude Code no terminal
- Claude Code seta effort = high automaticamente (se API-key, Bedrock, Vertex, Foundry, Team ou Enterprise)
- Dev pede para debugar o mesmo problema
- Modelo pensa profundamente, analisa mais cenários, considera mais edge cases
- Dev recebe uma resposta significativamente melhor
Para controlar o effort manualmente, basta usar o comando /effort:
# Ver effort atual
/effort
# Mudar para low (economia máxima)
/effort low
# Mudar para medium (equilíbrio)
/effort medium
# Mudar para high (novo default — qualidade)
/effort high
# Mudar para max (sem limites — apenas Opus 4.6)
/effort max
O nível persiste entre sessões. Também pode ser configurado via variável de ambiente CLAUDE_CODE_EFFORT_LEVEL, via settings.json com effortLevel, ou até por skill/subagent individual via frontmatter effort.
Para um controle pontual sem mudar a sessão inteira, basta incluir “ultrathink” no prompt — isso ativa high effort para aquela resposta específica.
Por que isso importa para a sua Software House
Vou ser direto: se a sua SH tem 20 devs usando Claude Code via API ou Bedrock, todos estavam operando com qualidade subótima até a v2.1.94 atualizar.
O impacto em qualidade é real. Em high effort, o Claude Code:
- Faz mais tool calls para investigar antes de responder
- Explica o plano antes de executar
- Gera código com mais comentários e tratamento de edge cases
- Analisa trade-offs antes de sugerir uma arquitetura
- Debugga com mais profundidade, testando mais hipóteses
A Anthropic divulgou que internamente, os funcionários usam Claude em 59% do trabalho diário com +50% de produtividade. Mas isso é com effort high — o default que eles sempre usaram internamente. O resto do mercado estava rodando em medium.
O impacto em custo também é real. High effort consome mais tokens. Segundo dados da Morph LLM, workflows agentic de codificação consomem 1 a 3.5 milhões de tokens por tarefa. Com high effort, esse número tende ao topo da faixa. Para Enterprise, isso pode significar a diferença entre US$ 500/dev/mês e US$ 800/dev/mês.
A boa notícia: a Anthropic recomenda configurar effort dinamicamente por tipo de tarefa. Tarefas simples em low, tarefas do dia a dia em medium, debugging e arquitetura em high, problemas críticos em max. Isso é FinOps aplicado a AI coding.
Os números que importam
Os dados do mercado em 2026 contextualizam por que essa mudança é mais importante do que parece:
- 85% dos desenvolvedores usam IA regularmente para codificação, debugging e code review (Modall)
- 92% de redução no tempo médio de tarefas com Claude vs sem IA — de 3.1h para ~15 minutos (Anthropic)
- US$ 500-2.000/mês por dev em custos de API para quem usa Claude Code como agente (Morph LLM)
- 60-80% de economia possível com estratégias de otimização de tokens (Moltbook AI)
- 40% das aplicações enterprise terão agents task-specific até fim de 2026 (Master of Code)
- O Claude Code atingiu US$ 1 bilhão em receita anualizada em novembro de 2025 — o ramp mais rápido da história de software enterprise (Uncover Alpha)
A questão não é “usar ou não usar IA”. É como usar. E a diferença entre medium e high effort é a diferença entre um assistente que responde e um que realmente pensa.
O que eu penso
Essa mudança me incomoda por um motivo: deveria ter sido assim desde o começo.
A Anthropic criou uma ferramenta que intencionalmente rodava abaixo do potencial para a maioria dos usuários pagantes. A API direta já defaultava high. O Claude Code — a ferramenta que mais desenvolvedores usam no dia a dia — defaultava medium. Por quê? Provavelmente para controlar custos de infraestrutura e evitar que users consumissem demais nos primeiros meses.
Agora que o produto escalou e a Anthropic precisa justificar o pricing Enterprise, faz sentido desbloquear a qualidade total. Mas quantos meses de código subótimo foram entregues nesse meio tempo?
O lado positivo: agora que high é o default, a diferença de qualidade vai ser perceptível. Se os seus devs reclamavam que “o Claude às vezes é superficial” ou “não pega todos os edge cases”, provavelmente era porque estavam em medium sem saber.
Minha recomendação para software houses: não aceite o default cegamente. Configure effort por cenário:
- Subagents e tarefas automatizadas: low (economia)
- Coding do dia a dia: medium ou high (depende do budget)
- Code review e debugging complexo: high
- Decisões arquiteturais e refactoring major: max (com Opus 4.6)
E monitore o /cost semanalmente. Agora que o default subiu, o consumo de tokens vai subir junto. Sem governance, a conta escala rápido.
Conclusão
A v2.1.94 do Claude Code não tem nenhum banner chamativo, nenhum anúncio de feature revolucionária. É uma linha no changelog: “Changed default effort level from medium to high.” Mas para quem entende de token economics e AI coding, essa é possivelmente a mudança mais impactante do trimestre.
Seus devs vão escrever código melhor amanhã sem mudar nada no workflow. A IA vai pensar mais antes de responder. Os edge cases vão ser cobertos. O debugging vai ser mais profundo. E a conta de tokens vai subir.
Se você quer implementar esse nível de inteligência artificial na sua software house com controle de custo e governance real, precisa entender que a ferramenta é só metade da equação. A configuração é a outra metade.
Sou Thulio, mentoro 300+ software houses desde 2016. E posso te garantir: a diferença entre uma SH que configura suas ferramentas e uma que aceita o default é a diferença entre escalar e sobreviver.



