Vou ser direto: se você está construindo qualquer coisa com agentes de IA na sua software house — e se não está, a gente precisa conversar — o maior problema que você vai enfrentar não é o modelo. É o contexto.
Eu vejo isso toda semana nas 300+ software houses que mentoro. O CEO chega empolgado: “Thulio, a gente colocou um agente de IA no nosso produto!”. Aí eu pergunto: “Legal, e como ele lembra das coisas?”. Silêncio.
Pois é. E é exatamente isso que um projeto chinês com 15 mil stars no GitHub acabou de resolver de um jeito que eu nunca tinha visto antes.
O que é o OpenViking
OpenViking é um banco de dados de contexto open-source feito especificamente para agentes de IA. Foi criado pela Volcengine, a divisão de cloud da ByteDance — sim, a mesma empresa do TikTok.
Em números: 15.424 stars, 1.041 forks, e ganhou mais de 9.300 stars só na última semana. No dia 15 de março, bateu #1 trending no GitHub inteiro. Isso não é hype — é a comunidade global de desenvolvedores dizendo “era isso que eu precisava”.
A licença é Apache 2.0, ou seja, pode usar comercialmente sem medo.
O problema que ninguém fala (mas todo mundo sofre)
Quando você joga RAG tradicional num agente, sabe o que acontece? Memórias ficam num canto, recursos em outro, skills espalhadas. É como se seu agente tivesse Alzheimer seletivo — lembra de pedaços, mas nunca do quadro completo.
E o pior: quando o retrieval falha (e vai falhar), você não tem ideia de por quê. É uma caixa preta. O agente deu uma resposta errada? Boa sorte debugando.
Na minha experiência com 300+ SHs, esse é o motivo #1 pelo qual projetos de IA vão pro ar empolgados e voltam decepcionantes. Não é culpa do modelo. É o contexto fragmentado.
Como o OpenViking resolve isso (e por que é genial)
A sacada do OpenViking é tão simples que dá raiva de ninguém ter feito antes: tratar o contexto do agente como um sistema de arquivos.
Pensa assim: ao invés de jogar tudo num vetor store flat (o que todo mundo faz com RAG), o OpenViking organiza memórias, recursos e skills em diretórios e arquivos. Como se fosse o Finder do seu Mac ou o Explorer do Windows.
Na prática funciona assim:
- Instala:
pip install openviking - Configura: Escolhe seu provider de LLM (OpenAI, Claude, DeepSeek, Gemini, Ollama — suporta tudo)
- Organiza: Cria a estrutura de contexto como pastas e arquivos
- Consulta: O agente navega pelo “file system” inteligentemente — primeiro acha o diretório certo, depois busca recursivamente dentro dele
E o pulo do gato: carregamento em 3 camadas (L0/L1/L2). L0 é o resumo abstrato, L1 é o overview, L2 é o detalhe completo. O agente só carrega o que precisa, quando precisa.
Resultado? 82% menos tokens consumidos — de 24.6 milhões para 2.1 milhões. E a taxa de conclusão de tarefas subiu de 35.65% para 51.23%. Lê de novo: gastou menos E funcionou melhor.
Os números que importam para o seu bolso
Vou traduzir isso pra linguagem de CEO de software house:
- 82% menos tokens = se você gasta R$ 10 mil/mês com API de LLM, passa a gastar R$ 1.800. São R$ 8.200 de economia todo mês
- 51% de task completion (vs 35% anterior) = seus agentes acertam quase 50% mais. Menos retrabalho, menos chamados de suporte
- Trajetória de retrieval visível = quando o cliente perguntar “por que o agente fez isso?”, você tem a resposta. Compliance, auditoria, confiança
E como é Apache 2.0, não tem vendor lock-in. Suporta desde Ollama rodando local até Claude da Anthropic na nuvem.
Como usar na sua software house (3 cenários reais)
1. Agente de atendimento turbinado
Ao invés de embeddings flat do histórico do cliente, o OpenViking organiza: /clientes/empresa-x/historico/, /clientes/empresa-x/contratos/, /clientes/empresa-x/preferencias/. O agente navega hierarquicamente e dá respostas com contexto completo.
2. Base de conhecimento interna que evolui
Skills do time, processos, documentações — tudo organizado como file system. O melhor: a auto-evolução do OpenViking comprime sessões automaticamente e extrai memória de longo prazo. Quanto mais usa, mais inteligente fica.
3. Redução radical de custos de IA
Se sua SH roda milhares de queries por dia em agentes, 82% de economia em tokens é a diferença entre um projeto viável e um projeto que sangra dinheiro.
O que eu penso
Na minha experiência com 300+ software houses, o maior erro que vejo é tratar IA como “jogar um prompt e torcer pro melhor”. Falta engenharia no contexto. Falta estrutura na memória.
OpenViking não é sexy. Não é um chatbot bonito nem um copilot que escreve código. É infraestrutura. É o tipo de ferramenta que separa a software house que está brincando de IA da que está construindo produto de verdade.
E o fato de vir da ByteDance — uma empresa que roda IA em escala absurda com o TikTok — me dá confiança que isso foi testado em produção antes de virar open-source.
Se você está construindo agentes de IA no seu produto (ou planejando), anota esse nome: OpenViking. Pode ser o que estava faltando entre o seu agente “que funciona às vezes” e um agente que realmente entrega.
Se você quer implementar esse nível de engenharia de IA na sua software house e não sabe por onde começar, me chama. Já ajudei centenas de SHs a sair do “estamos experimentando IA” pra “IA é nosso diferencial competitivo”.
Sou Thulio, mentoro 300+ SHs desde 2016.
Fontes: GitHub – OpenViking | OpenViking.ai | MarkTechPost | Alabia Insights | DecisionCrafters