Semana passada eu estava olhando o consumo de tokens de um time de 15 devs que mentoro. Eles usam Claude Code diariamente. O gasto? R$22.000 por mês. Não é absurdo pra um time desse tamanho — até faz sentido pelo retorno. Mas o que me incomodou foi outra coisa: boa parte desses tokens estavam sendo queimados em operações internas que o dev nem vê.
Uma dessas operações é o Write tool. E na v2.1.92, lançada dia 4 de abril, a Anthropic acelerou o cálculo de diff do Write tool em 60% para arquivos grandes. Parece técnico demais? Parece. Mas quando você entende o que acontece por baixo, percebe que é dinheiro.
Vou te explicar por quê.
O Que é o Write Tool e Por Que Ele Importa
O Claude Code tem um conjunto de ferramentas internas que ele usa para interagir com o seu código. As três principais para manipulação de arquivos são:
- Read — lê conteúdo de arquivos
- Edit — faz edições cirúrgicas em trechos específicos
- Write — cria ou sobrescreve arquivos inteiros
O Write é a ferramenta de criação. Todo arquivo novo que o Claude Code gera — um componente React, um migration, um teste, um script — passa pelo Write tool. E quando ele sobrescreve um arquivo existente (rewrite completo), também é o Write que entra em ação.
Mas o Write não simplesmente “cola” o conteúdo novo no arquivo. Internamente, ele calcula um diff — a diferença entre o que existe e o que vai ser escrito. Esse diff serve pra validação, pra garantir integridade, e pra que o sistema saiba exatamente o que mudou.
O problema? Esse cálculo de diff era lento em arquivos grandes. Especialmente em arquivos com caracteres especiais como tabs e $ — que são extremamente comuns em codebases reais (pense em arquivos de configuração, shell scripts, templates, código legado com tabulação).
O Que Mudou na v2.1.92
A v2.1.92 do Claude Code trouxe uma melhoria direta: Write tool diff computation speed 60% faster on large files. Na prática, o algoritmo de diff foi otimizado para processar arquivos grandes em quase metade do tempo anterior.
Isso significa que toda vez que o Claude Code cria ou reescreve um arquivo grande, ele gasta menos tempo computando, o que se traduz em:
- Menos latência — o dev espera menos entre pedir e receber
- Menos tokens de processamento — tempo de computação se traduz em tokens consumidos
- Sessões mais fluidas — menos “travadas” em operações de arquivo
Pode parecer incremental. Mas multiplica.
A Matemática Que Ninguém Faz
Vamos aos números. Segundo dados da Morph LLM, que analisou 42 sessões reais de coding agents:
- 70% dos tokens em sessões de coding agents são desperdício
- Apenas 5-15% dos tokens vão efetivamente para geração de código
- O resto vai para navegação, busca, operações internas e overhead
E aqui entra o detalhe cruel: output tokens custam 4-5x mais que input tokens. Nos modelos flagship, estamos falando de $2-3 por milhão de tokens de input versus $10-15 por milhão de tokens de output. O Write tool gera output tokens — ele precisa produzir o conteúdo do arquivo inteiro.
Agora pense numa software house com 20 desenvolvedores:
- Cada dev faz dezenas de operações de Write por dia (novos arquivos, rewrites, testes, migrations)
- Cada operação em arquivo grande consumia X tokens de diff computation
- Com 60% de redução no tempo de diff, a economia de tokens por operação se acumula
- 20 devs × ~30 writes/dia × tokens economizados = milhares de tokens por dia que voltam pro orçamento
A Fast.io estima que otimizações combinadas podem entregar 40-70% de redução de custo em operações de AI agents. O Write tool faster é uma peça desse quebra-cabeça.
O Stack de Otimização Silencioso
O que me chamou atenção é que essa não é uma melhoria isolada. A Anthropic vem construindo um stack de otimização de tokens no Claude Code ao longo das últimas versões:
| Versão | Otimização | Impacto |
|---|---|---|
| v2.1.86 | Read tool compact format | Menos tokens pra ler arquivos |
| v2.1.89 | Hook output cap 10K chars | Limita overhead de hooks |
| v2.1.91 | Edit tool shorter anchors | Menos output tokens por edit |
| v2.1.92 | Write tool diff 60% faster | Menos tempo/tokens em criação de arquivo |
| v2.1.92 | Prompt caching | Até 90% economia em prefixos repetidos |
Cada uma dessas otimizações sozinha parece pequena. Juntas, elas atacam o problema de todos os ângulos: input, output, processamento, overhead.
É engenharia de custo. Não é feature sexy. Não vai ter demo no Twitter. Mas é o que faz a diferença entre uma SH que gasta R$15.000/mês com IA e uma que gasta R$25.000 pelo mesmo resultado.
Por Que Isso Importa Pra Sua Software House
Na minha experiência com 300+ software houses, o padrão que vejo é sempre o mesmo: o CEO compra as licenças, os devs usam, e ninguém olha pra economia de tokens.
Segundo a Morph LLM, o uso típico de Claude Code com API billing fica entre $200-500/mês por desenvolvedor. Heavy users passam de $800/mês. Pra um time de 20 devs, estamos falando de $4.000 a $10.000 por mês — R$20.000 a R$50.000 na cotação atual.
E aí vem o dado que me preocupa: 92.6% dos desenvolvedores já usam AI coding tools (DX.tips, 121K devs, 450+ empresas), mas o ganho real de produtividade está travado em 10%. Um estudo da METR com desenvolvedores experientes mostrou que, em certas condições, AI tools até tornam devs 19% mais lentos.
O ponto não é que IA não funciona. Funciona. Mas funciona melhor quando o custo por operação é baixo o suficiente pra justificar o volume de uso. Se cada Write em arquivo grande demora 60% a mais do que precisa, o dev ou espera mais (perde flow) ou gasta mais tokens (perde dinheiro).
Otimizações como essa do Write tool atacam exatamente o gargalo: tornam o uso mais barato e mais rápido ao mesmo tempo.
O Que Eu Penso
Eu acompanho o changelog do Claude Code todos os dias. E o padrão que estou vendo é claro: a Anthropic está tratando token economics como produto, não como infraestrutura.
Cada versão traz uma otimização que reduz tokens aqui, acelera processamento ali, compacta contexto acolá. Não é acidente. É uma estratégia deliberada pra tornar o Claude Code economicamente viável em escala — e isso é exatamente o que software houses precisam.
O CEO médio de SH não liga pra diff computation speed. Ele liga pra quanto paga por mês e quanto produz. Mas uma coisa leva à outra: Write tool 60% mais rápido → menos tokens por operação → custo menor por sessão → mais sessões no mesmo orçamento → mais código produzido.
A pergunta que você deveria estar fazendo não é “o que meu time está produzindo com IA?” — é “quanto meu time está desperdiçando em tokens que não viram código?”
Se a resposta for “não sei”, começa pelo /cost e olha o breakdown por modelo e cache hits. Você vai se surpreender.
Conclusão
O Write tool diff 60% mais rápido não vai aparecer em nenhum keynote. Não vai ter thread viral. Mas pra quem roda Claude Code em produção com 10, 20, 50 devs, é o tipo de atualização que impacta direto no P&L.
Na minha experiência, as software houses que estão ganhando com IA não são as que compram mais licenças — são as que entendem a economia de tokens e otimizam cada camada. Read, Edit, Write, caching, model routing. Cada peça importa.
Se você quer implementar esse nível de gestão de IA na sua software house, acompanha os próximos artigos. Eu documento cada atualização relevante aqui.
Sou Thulio, mentoro 300+ SHs desde 2016.




