Muita gente embarcou na onda do vibe coding com uma empolgação perigosa: gerar código com IA e mandar direto para produção. Sem testes. Sem validação. Sem rede de segurança.
O resultado? Bugs silenciosos, vulnerabilidades de segurança e retrabalho que consome mais tempo do que se tivessem escrito o código manualmente. A verdade é dura: programar com IA sem testes automatizados é a receita mais rápida para o fracasso.
E isso não é opinião. Os dados comprovam.
O Código da IA Tem 1,7x Mais Problemas
Um estudo da CodeRabbit analisou 470 pull requests reais em projetos open-source e chegou a uma conclusão alarmante: código gerado por IA produz 1,7 vezes mais problemas do que código escrito por humanos.
Os números são ainda piores quando olhamos categorias específicas:
- Erros de lógica e correção: 1,75x mais frequentes
- Vulnerabilidades de segurança: 1,57x mais frequentes
- Problemas de performance: 1,42x mais frequentes
- Vulnerabilidades XSS: 2,74x mais prováveis
E não para aí. Um levantamento da Kaspersky testou 5 ferramentas de vibe coding em 15 aplicações e encontrou 69 vulnerabilidades de segurança. Mais de 40% do código gerado continha falhas de segurança, sendo a falta de sanitização de input a mais frequente.
A Ilusão de Velocidade
Um dos dados mais reveladores vem do estudo METR, que realizou um ensaio controlado com 16 desenvolvedores experientes em 246 tarefas reais. O resultado: desenvolvedores foram 19% mais lentos usando ferramentas de IA para programar.
O mais surpreendente? Antes do estudo, eles previam que seriam 24% mais rápidos. E mesmo depois, ainda acreditavam ter sido 20% mais rápidos. Uma ilusão completa.
O motivo é simples: o tempo gasto revisando, debugando e corrigindo o output da IA anula os ganhos de velocidade na geração inicial. Sem testes automatizados que peguem os erros cedo, o ciclo de correção manual se torna um dreno de produtividade.
O Retrabalho Explodiu
Dados da GitClear mostram que o code churn — linhas de código reescritas em menos de duas semanas — saltou de 5,5% para 7,9% desde a adoção massiva de IA. A previsão é que esse número dobre até o final de 2026.
Ao mesmo tempo, a refatoração caiu de 25% das linhas alteradas em 2021 para menos de 10% em 2024. Os devs estão produzindo mais código, mas código de qualidade inferior que precisa ser refeito logo em seguida.
É exatamente o cenário que o Thulio Bittencourt alerta no seu canal: empresas que não têm uma única classe de teste implementada. Funciona por um tempo, até que a IA alucina em algo crítico e não existe nenhuma rede de segurança para pegar.
A Anthropic Confirma: Testes São Essenciais
A própria Anthropic, criadora do Claude Code, lançou em março de 2026 um sistema multi-agente de Code Review especificamente para endereçar a qualidade do código gerado por IA.
Os dados internos são claros: em PRs grandes (1.000+ linhas), 84% das revisões automatizadas encontraram problemas, com uma média de 7,5 issues por review. Desenvolvedores rejeitaram menos de 1% dos problemas identificados — ou seja, a IA realmente erra, e os testes pegam esses erros.
A recomendação oficial da Anthropic? Tight feedback loops: escrever código → rodar testes → corrigir falhas. Os desenvolvedores que mais aproveitam agentes de IA são justamente aqueles com práticas sólidas de teste.
Como Implementar Testes com IA
Se você está usando IA para programar, aqui está o mínimo inegociável:
Conclusão
IA na programação não é boa nem ruim — depende de como você usa. Sem testes, é um acelerador de dívida técnica. Com testes, é um multiplicador de produtividade real.
A mensagem do Thulio é clara: se sua software house não tem testes implementados, você está construindo sobre areia. E quando a IA alucinar — porque vai alucinar — não vai ter nada para impedir que o erro chegue ao cliente.
Implemente testes. Use IA com responsabilidade. E pare de tratar qualidade como opcional.
—
Fontes:



