Home / Claude Code / Como o /effort do Claude Code Corta Seus Custos de IA

Claude Code

Como o /effort do Claude Code Corta Seus Custos de IA

18/03/2026

Desenvolvedor usando Claude Code com effort level configurado no terminal — controle de custos de IA

Deixa eu te fazer uma pergunta direta: você sabe quanto o Claude está “pensando” antes de responder para você?

Provavelmente não. E isso está custando dinheiro da sua software house todos os dias.

Na minha experiência acompanhando mais de 300 SHs desde 2016, um dos padrões que mais vejo é o seguinte: a empresa adota Claude Code, fica impressionada com os resultados, e continua usando no piloto automático sem nunca ajustar os parâmetros de uso. É como contratar um consultor sênior e pedir pra ele revisar um e-mail simples — funciona, mas você está pagando por muito mais do que precisa.

A Anthropic lançou o comando /effort (v2.1.76) exatamente pra resolver isso. E mais: silenciosamente mudou o padrão do Opus 4.6 de “high” para “medium” para assinantes Max e Team. Isso afeta você agora. A questão é: você entende o que mudou?

O que é o /effort command

O /effort é um novo comando do Claude Code que controla o nível de raciocínio adaptativo do modelo antes de gerar uma resposta. Em termos simples: ele determina quanto o Claude pensa antes de te responder.

Isso não é um ajuste cosmético. O Claude Code usa o que a Anthropic chama de “adaptive reasoning” — um mecanismo onde o modelo aloca dinamicamente tokens de “pensamento” baseado na complexidade da tarefa. Mais esforço = mais tokens de raciocínio = resposta mais profunda (e mais cara). Menos esforço = resposta mais rápida e econômica.

Antes desse comando, você não tinha controle sobre isso. O modelo decidia sozinho. Agora, você manda.

Se você já usa o comando /context para otimizar o que entra no contexto do Claude, o /effort complementa essa estratégia controlando o quanto o modelo pensa sobre o que você manda.

Para entender melhor, a documentação oficial do Claude Code explica que o effort controla o “adaptive reasoning, which dynamically allocates thinking based on task complexity.”

Os 4 níveis do /effort

Existem quatro configurações disponíveis, e cada uma tem um propósito distinto:

`low` — Velocidade máxima, custo mínimo

Use quando você precisa de respostas rápidas para tarefas simples: escrever um comentário, renomear uma variável, formatar código, responder uma dúvida objetiva. O Claude responde com menos tokens de raciocínio e entrega a resposta mais rápido. Perfeito para tarefas rotineiras onde velocidade importa mais que profundidade.

`medium` — O equilíbrio inteligente

É o novo padrão do Opus 4.6 para assinantes Max e Team. A Anthropic fez essa mudança deliberadamente — é o ponto onde você tem performance sólida sem o custo total do modo high. Para a maioria das tarefas do dia a dia de uma software house (code review, debug, refatoração moderada), esse nível entrega 90% da qualidade por um custo significativamente menor.

`high` — Para o trabalho sério

Era o padrão anterior. Use quando você precisa do melhor do Claude: arquitetura de sistema complexo, debugging de problemas difíceis, análise profunda de código legado, decisões de design que impactam toda a base de código. Aqui você quer que o Claude pense devagar e com cuidado.

`max` — Tudo que o modelo tem

Disponível apenas no Opus 4.6 e só funciona na sessão atual (não persiste). É o modo onde o Claude não tem limite de tokens de raciocínio — ele pensa o quanto for necessário. Use com parcimônia: tarefas extremamente complexas onde a qualidade da resposta tem impacto financeiro direto no projeto. Pode ser significativamente mais caro e mais lento.

Como funciona na prática

Configurar o effort level é simples. Durante uma sessão, basta digitar:

# Definir baixo esforço para tarefas simples
/effort low

# Voltar ao balanceado
/effort medium

# Máxima profundidade de raciocínio (Opus 4.6 only)
/effort max

# Resetar para o padrão do modelo
/effort auto

Mas tem formas mais sofisticadas de configurar isso no workflow da sua SH:

Via flag na inicialização:

# Iniciar Claude Code com effort definido para a sessão inteira
claude --effort low

Via variável de ambiente (para scripts e automações):

export CLAUDE_CODE_EFFORT_LEVEL=medium

Via settings.json (configuração permanente):

{
  "effortLevel": "medium"
}

Via interface /model: Use as setas para ajustar o slider de effort ao selecionar o modelo. O nível atual aparece ao lado do logo do Claude Code: “with low effort”, “with medium effort”, etc.

A hierarquia de prioridade: variável de ambiente > configuração no settings > padrão do modelo.

Por que isso importa para sua Software House

Vou ser direto: custos de IA estão crescendo na maioria das SHs que acompanho. Não porque o preço por token aumentou — mas porque o uso está escalando sem controle.

Quando você tem um time de 5, 10, 20 devs usando Claude Code, o nível de effort de cada um multiplica. Se todo mundo está no high por padrão para tarefas que não precisam disso, você está desperdiçando tokens de raciocínio em escala.

Pensa na distribuição real de tarefas de um desenvolvedor:

~40% do dia: Tarefas simples — escrever testes unitários básicos, ajustar CSS, renomear funções, escrever documentação simples → low ou medium
~40% do dia: Tarefas moderadas — refatoração, debugging de bugs conhecidos, implementar features especificadas → medium ou high
~20% do dia: Tarefas complexas — arquitetura, bugs obscuros, design decisions → high ou max

Se você está rodando high em 100% das interações, você está pagando pelo raciocínio profundo em 80% das situações onde ele é desnecessário.

A mudança de padrão do Opus 4.6 para medium é a Anthropic reconhecendo exatamente isso: para a maioria dos casos de uso, medium é suficiente. Eles tomaram a decisão por você para o Opus, mas você precisa tomar essa decisão conscientemente para o seu time.

Benchmarks e dados reais

O artigo de Kent Gigger sobre o effort parameter traz uma perspectiva prática importante: a diferença de qualidade entre medium e high é imperceptível em tarefas do dia a dia, mas o custo em tokens pode ser significativamente diferente dependendo do contexto e da complexidade do sistema prompt.

A Anthropic não publicou números exatos de redução de custo por nível, o que faz sentido — depende do tipo de tarefa. Mas a lógica é direta: menos tokens de raciocínio = resposta mais barata em tokens de saída.

Um ponto importante que muita gente não percebe: o max no Opus 4.6 não persiste entre sessões. Isso é uma decisão deliberada da Anthropic — eles não querem que você fique preso acidentalmente no modo mais caro. Cada sessão começa do seu effortLevel configurado.

O que eu penso

Vou ser honesto: quando vi o /effort command, minha primeira reação foi “mais uma configuração que ninguém vai usar.” Errei.

Depois de conversar com donos de SHs que já estão usando Claude Code com times, o padrão que vejo é o seguinte: ninguém para para pensar no custo por interação. A pessoa vê o resultado e fica feliz. O boleto chega no fim do mês e aí começa a pergunta — “por que tá tão caro?”

O /effort é o tipo de feature que parece pequena mas é filosoficamente importante. Ela te força a pensar: qual é o nível de qualidade que essa tarefa realmente exige?

E isso, na minha visão, é uma mentalidade que toda software house deveria ter sobre qualquer recurso — não só IA. Você não usa um parafuso de inox em todo lugar só porque é melhor que o normal. Você usa onde faz sentido.

A IA é igual. Calibrar o esforço cognitivo do modelo para o tipo de tarefa não é uma otimização técnica — é gestão consciente de recurso. E isso é o que separa software houses que escalam com IA das que ficam com um custo crescente e resultado proporcional decrescente.

Conclusão

O /effort command chegou discretamente no Claude Code v2.1.76, mas o impacto para software houses que usam o Opus 4.6 foi imediato: o padrão mudou de high para medium. Se você ainda não parou para configurar o effort level do seu time, provavelmente está gastando mais do que precisa — ou deixando performance na mesa nos momentos onde high seria o certo.

A minha recomendação prática: configure effortLevel: "medium" no settings.json como base, ensine seu time a usar /effort high quando entrar em tarefas complexas, e reserve /effort max para os problemas que realmente merecem o pensamento mais profundo do Claude.

Custo de IA é custo operacional. E custo operacional é gestão. Trate com a seriedade que merece.

Se você quer entender como implementar esse nível de controle operacional de IA na sua software house — do custo à qualidade, do time individual ao processo de desenvolvimento — é exatamente o que trabalho com as SHs que mentoro.

Sou Thulio, mentoro 300+ SHs desde 2016.

Links e Fontes

Marcado:agentes de IA automação Claude Code custos-ia effort ferramentas-dev opus produtividade software house sonnet

Thulio Bittencourt

Como o /effort do Claude Code Corta Seus Custos de IA

O que é o /effort command

Os 4 níveis do /effort

`low` — Velocidade máxima, custo mínimo

`medium` — O equilíbrio inteligente

`high` — Para o trabalho sério

`max` — Tudo que o modelo tem

Como funciona na prática

Por que isso importa para sua Software House

Benchmarks e dados reais

O que eu penso

Conclusão

Links e Fontes

Vertical SaaS: Por Que Sua Expertise Vale Mais que Código

Criar App com IA em Minutos: Google Stitch, Agente e Supabase

Deixe um Comentário Cancelar resposta

Como o /effort do Claude Code Corta Seus Custos de IA

O que é o /effort command

Os 4 níveis do /effort

low — Velocidade máxima, custo mínimo

medium — O equilíbrio inteligente

high — Para o trabalho sério

max — Tudo que o modelo tem

Como funciona na prática

Por que isso importa para sua Software House

Benchmarks e dados reais

O que eu penso

Conclusão

Links e Fontes

Vertical SaaS: Por Que Sua Expertise Vale Mais que Código

Criar App com IA em Minutos: Google Stitch, Agente e Supabase

Related Posts

Claude Code /context: Onde Seus Devs Estão Queimando Tokens

Claude Code Voice: Seus Devs Falam 3x Mais Rápido do que Digitam

Deixe um Comentário Cancelar resposta

`low` — Velocidade máxima, custo mínimo

`medium` — O equilíbrio inteligente

`high` — Para o trabalho sério

`max` — Tudo que o modelo tem