Home / Inteligência Artificial / Graphify: 71x Menos Tokens Para Seu Agente de IA Entender o Código

Graphify: 71x Menos Tokens Para Seu Agente de IA Entender o Código

Graphify: 71x Menos Tokens Para Seu Agente de IA Entender o Código

Quanto tempo seu time gasta explicando o projeto pro ChatGPT? Ou pro Claude Code? Ou pra qualquer agente de IA que vocês usam no dia a dia?

Eu vejo isso em praticamente toda software house que mentoro. O dev abre o Claude Code, cola metade do projeto no prompt, gasta 50 mil tokens pra dar contexto, e aí faz a pergunta. No dia seguinte? Mesma coisa. De novo. Porque o agente esqueceu tudo.

Isso não é produtividade. Isso é desperdício disfarçado de automação.

E é exatamente esse problema que o Graphify resolve — de um jeito que eu sinceramente não esperava ver tão cedo.

O que é o Graphify

Graphify é um skill open-source que transforma qualquer pasta de código, documentação, PDFs, screenshots e até diagramas de quadro branco em um knowledge graph consultável. Você instala, indexa o projeto uma vez, e a partir daí seu agente de IA consulta o grafo em vez de reler arquivos.

O resultado? 71.5x menos tokens por query.

Não é um typo. Setenta e um vezes menos.

O projeto foi criado por Safi Shamsi, um AI Engineer da Valent Projects em Londres, com mestrado em Data Science pela University of Birmingham. Ele não é uma big tech. É um cara que viu o problema, entendeu a estrutura, e resolveu.

Hoje o Graphify tem 14.200+ stars, 1.400 forks, 10 contributors, 20 releases, e está #2 no Trendshift — uma das posições mais cobiçadas do ecossistema open-source.

Licença? MIT. Grátis. Para sempre.

O problema que ninguém estava resolvendo direito

Todo mundo que usa agentes de IA para codar conhece essa dor: contexto.

Seu projeto tem 200 arquivos. O agente de IA precisa entender como autenticação se conecta com o rate limiter, como o módulo de pagamento depende do serviço de notificação, como aquele componente legado que ninguém toca ainda é critical path.

As soluções até agora eram:

  • RAG (Retrieval-Augmented Generation): Vector stores, embeddings, chunks. Funciona razoavelmente, mas é pesado de configurar, caro de manter, e frequentemente retorna contexto irrelevante.
  • Ler código raw: O agente lê os arquivos diretamente. Funciona, mas gasta uma quantidade absurda de tokens. E leitura linear não revela conexões entre componentes.
  • CLAUDE.md e context files: Útil, mas manual. Alguém precisa escrever e manter esses arquivos.
  • Graphify faz diferente. Ele não usa embeddings. Não usa vector store. Ele constrói um grafo de conhecimento baseado na topologia real do código — e isso muda tudo.

    Como funciona (sem enrolação)

    Dois comandos pra instalar:

    pip install graphifyy
    

    graphify install

    Um comando pra indexar:

    /graphify .
    

    E pronto. Em 2 a 5 minutos (para 50-100 arquivos), você tem um knowledge graph completo.

    O processo roda em duas passadas:

    Passada 1 — Determinística (zero LLM): Tree-sitter faz parsing do AST de 20 linguagens — Python, TypeScript, Go, Rust, Java, C, C++, Ruby, C#, Kotlin, Scala, PHP, Swift, Lua, Zig, PowerShell, Elixir, Objective-C e Julia. Tudo local, tudo rápido, zero custo.

    Passada 2 — Semântica (com LLM): Claude subagents processam em paralelo os docs, PDFs e imagens. Extraem conceitos, relações, e contexto. Aqui é onde a mágica acontece — screenshots de quadro branco viram nós no grafo.

    O resultado é unificado em um grafo NetworkX com Leiden community detection para clustering. Cada relação é classificada como:

  • EXTRACTED — veio direto do código (determinístico)
  • INFERRED — o modelo deduziu (com score de 0.0 a 1.0)
  • AMBIGUOUS — incerto, sinalizado para revisão
  • Transparência total. Você sabe exatamente o que é fato e o que é inferência.

    Os números que importam

    Métrica Valor
    Redução de tokens (benchmark completo) 71.5x
    Redução de tokens (projeto pequeno) 5.4x
    Linguagens suportadas 20
    Plataformas compatíveis 6 (Claude Code, Codex, OpenCode, OpenClaw, Factory Droid, Trae)
    Stars 14.200+
    Releases 20
    Licença MIT
    Última release v0.3.17 (08/abr/2026)

    O benchmark de 71.5x foi medido em mixed corpora — repositórios do Karpathy + 5 papers acadêmicos + 4 imagens, totalizando 52 arquivos. Em projetos menores (4 arquivos), a redução é de 5.4x. A realidade da maioria das software houses está no meio: projetos de 50-200 arquivos, onde a redução fica provavelmente na faixa de 20-50x.

    Traduzindo: se você gasta R$ 500/mês de API com seu agente de IA relendo código, com Graphify pode cair pra R$ 10-25/mês na parte de contexto.

    Como usar na sua software house

    Aqui é onde eu fico mais empolgado, porque os use cases são imediatamente práticos:

    1. Onboarding de devs novos

    Dev novo chega, instala Graphify, indexa o projeto. Em 5 minutos tem um mapa visual interativo de todo o codebase. Pode perguntar pro Claude Code: “como autenticação se conecta ao módulo de pagamento?” e receber uma resposta baseada na estrutura real, não em achismo.

    2. Code review com contexto

    Antes de revisar um PR, o dev consulta o grafo: “qual é o blast radius dessa mudança no módulo X?” O grafo mostra todas as dependências e conexões. Review mais rápido, mais seguro.

    3. Migração de legado

    Você tem aquele projeto Java de 2018 que ninguém quer mexer? Indexa com Graphify. Descobre dependências ocultas, God classes, módulos desconectados. Planeja a migração com dados reais.

    4. Documentação que se mantém sozinha

    Exporta o grafo como wiki Obsidian-compatible, ou SVG, ou GraphML. Conecta com Neo4j se quiser algo mais robusto. A “documentação” é o próprio grafo — atualiza junto com o código via --watch mode ou git hooks.

    5. Multi-modal de verdade

    Seu time tem PDFs de requisitos, screenshots de wireframes, diagramas de arquitetura em Miro? Tudo vira nó no mesmo grafo. A análise técnica e a documentação de negócio conectadas numa estrutura só.

    O que eu penso

    Na minha experiência com 300+ software houses, o maior gargalo da adoção de IA não é a ferramenta. É o contexto.

    Equipes compram Claude Code, compram Cursor, compram Copilot — e depois gastam mais tempo dando contexto pro agente do que recebem de volta em produtividade. É frustrante. E é o motivo pelo qual muita gente desiste de usar IA pra codar depois de 2 semanas.

    Graphify ataca direto nesse ponto. Não é mais um framework de agente, não é mais um wrapper de LLM. É uma camada de inteligência estrutural que faz qualquer agente de IA entender seu projeto de verdade.

    O fato de ser MIT, instalável em 2 comandos, e funcionar com 6 plataformas diferentes elimina quase toda objeção de adoção. Não precisa de infra. Não precisa de cloud. Não precisa de budget.

    Tem limitações? Tem. O grafo pode ficar desatualizado após refactors grandes — o próprio README recomenda re-indexar a cada 2-3 semanas. E a segunda passada (semântica) depende de chamadas à API do modelo que você usa, então imagens e PDFs custam tokens de indexação. Mas são custos one-time.

    Acho que estamos vendo o início de uma categoria nova: code intelligence layers — ferramentas que ficam entre o código e o agente de IA, dando estrutura ao caos. Graphify, junto com projetos como code-review-graph e GitNexus, está definindo esse espaço. E pelo que vi do roadmap (o projeto Penpax, que vai conectar meetings, browser, emails e código num digital twin contínuo), o Safi Shamsi está pensando bem mais longe do que só código.

    Se sua software house usa qualquer agente de IA pra codar, instalar Graphify deveria ser o próximo passo depois de ler este artigo.

    Sou Thulio, mentoro 300+ SHs desde 2016.

    Marcado:

    Deixe um Comentário

    O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *