Deixa eu te fazer uma pergunta direta: quando foi a última vez que você tentou fazer o Claude ou o ChatGPT entender seu projeto inteiro?
Provavelmente você ficou copiando e colando arquivo por arquivo. Ou mandou o README e rezou. Ou desistiu e fez na mão mesmo.
Eu vejo isso toda semana nas 300+ software houses que mentoro. O time adota IA pra codar, mas na hora de fazer a IA realmente entender o projeto — a arquitetura, as dependências, o contexto — trava. Porque nenhum LLM consegue ler seu codebase inteiro se você não entregar ele no formato certo.
É exatamente isso que o Repomix resolve. E com um comando só.
O que é o Repomix
Repomix é uma ferramenta open-source que empacota repositórios inteiros num único arquivo otimizado para LLMs. Com npx repomix, seu projeto vira um XML, Markdown ou JSON que o Claude, ChatGPT, Gemini, DeepSeek ou qualquer outro modelo de linguagem consegue processar de ponta a ponta.
Os números falam por si:
- 23.115 stars no GitHub (trending recorrente)
- 45.534 downloads por semana no npm
- 3.513 commits — projeto maduro e ativamente mantido
- MIT License — use como quiser
Criado por Kazuki Yamada (@yamadashy), desenvolvedor independente de Tóquio, o Repomix nasceu de uma necessidade pessoal: ele queria usar Claude AI pra trabalhar no próprio código, mas não tinha como alimentar o modelo com o projeto inteiro. Então construiu a solução.
O problema real que ele resolve
Vou ser direto: o gargalo da IA em software houses hoje não é o modelo. É o contexto.
Você pode ter o Claude Opus 4.6 com 1 milhão de tokens de contexto. Mas se você não consegue empacotar seu codebase num formato que a IA entende, o modelo mais poderoso do mundo vai te dar respostas genéricas.
É como contratar o melhor consultor do mundo e não deixar ele ver o código.
O Repomix resolve isso com três coisas:
- Empacotamento inteligente — respeita .gitignore, filtra o que importa, estrutura com hierarquia
- Segurança automática — usa Secretlint pra detectar senhas e tokens antes de empacotar (imagine mandar sem querer sua API key pro ChatGPT)
- Contagem de tokens — mostra exatamente quantos tokens cada arquivo consome, pra você otimizar o que cabe no contexto da IA
Como funciona na prática
Não precisa instalar nada. Sério.
npx repomix@latest
Esse comando gera um repomix-output.xml com todo o seu repositório. Aí você cola no Claude, no ChatGPT, no Gemini — e a IA entende tudo.
Quer empacotar um repo remoto sem clonar?
npx repomix --remote user/repo
Quer só o diretório src/?
npx repomix src/ --include "**/*.ts"
Quer reduzir tokens em 70%?
npx repomix --compress
Essa última opção usa Tree-sitter pra extrair apenas as assinaturas do código — nomes de funções, tipos, interfaces — sem a implementação. A IA entende a estrutura inteira do projeto com uma fração dos tokens. Isso é brutal pra repos grandes.
Os diferenciais que fazem diferença
Tem muita ferramenta que faz “uma coisa parecida”. Mas o Repomix tem detalhes que mostram maturidade:
Claude Agent Skills Generation. Com repomix --skill-generate, ele cria Skills estruturadas para Claude Code — com summary, project-structure, files e tech-stacks. Isso significa que você pode gerar uma referência reutilizável do seu projeto (ou de qualquer repo open-source) e o Claude Code passa a “conhecer” aquele codebase permanentemente, sem precisar reempacotar toda vez.
MCP Server nativo. O Repomix funciona como Model Context Protocol server, se integrando diretamente ao Claude Code e outros assistentes de IA. Em vez de copiar e colar, a IA consulta seu codebase sob demanda.
3 formatos de output. XML (default, melhor pra Claude), Markdown (legível), JSON (pra pipelines). Você escolhe o que encaixa melhor no seu workflow.
Git logs como contexto. Com --include-logs, a IA recebe não só o código, mas o histórico de commits. “Por que esse arquivo mudou 15 vezes no último mês?” — a IA consegue responder.
Docker + GitHub Actions. Roda em container ou no CI/CD. Dá pra automatizar análise de PRs, gerar docs a cada merge, ou rodar security audit toda noite.
Como usar na sua software house
Na minha experiência com 300+ SHs, esses são os use cases que mais geram valor:
1. Code review com IA. Empacota o repo, cola no Claude, e pede: “Revise a arquitetura desse projeto. Quais são os 3 maiores riscos técnicos?” Eu já vi times encontrarem bugs críticos assim em 5 minutos que levariam dias de auditoria manual.
2. Onboarding de dev novo. Dev entrou segunda-feira? Empacota o projeto, gera uma Skill, e o Claude vira o “mentor” que conhece cada arquivo do codebase. O dev pergunta, a IA responde com contexto real do projeto. Reduz tempo de ramp-up drasticamente.
3. Migração de código legacy. Alimenta a IA com o codebase antigo (empacotado + comprimido com Tree-sitter) e pede um plano de migração. A IA vê todas as dependências, todos os patterns, todas as inconsistências. É como ter um arquiteto sênior analisando 100K linhas em minutos.
4. Documentação que ninguém escreve. Empacota o repo, pede pro Claude gerar ADRs, diagramas de arquitetura, API docs. O custo de documentação cai a praticamente zero.
5. Pipeline de qualidade automatizado. No CI/CD com GitHub Actions: a cada PR, empacota o diff, alimenta a IA, gera análise automática de segurança + performance + padrões. Funciona como um code reviewer incansável que nunca falta ao stand-up.
O que eu penso
Vou te dar minha opinião honesta: o Repomix é uma daquelas ferramentas que parece simples demais pra ser tão útil.
“Empacotar código num arquivo?” — parece trivial. Mas quando você entende que o context packing é o gargalo real do uso de IA em desenvolvimento, percebe que isso é infraestrutura.
O que me impressiona no Repomix não são as 23K stars. São os 45K downloads semanais no npm. Isso é adoção real. São devs usando isso todo dia, no workflow, em produção. Não é hype de GitHub trending que some em uma semana.
A feature de Claude Agent Skills é o que me faz acreditar que o Repomix vai virar padrão. Poder gerar uma referência estruturada de qualquer repo open-source e injetar no Claude Code como conhecimento permanente — isso muda a forma como times trabalham com IA.
O Kazuki Yamada, de Tóquio, construiu sozinho algo que grandes empresas não conseguiram. Uma ferramenta que todo dev que usa IA deveria ter no toolbox. Zero config, MIT license, funciona com qualquer LLM.
Se você tem uma software house e seu time usa IA pra codar — e eu espero que use — o Repomix deveria ser o primeiro npx que todo dev roda quando entra num projeto.
Sou Thulio, mentoro 300+ SHs desde 2016.
