NEXO Brain
Memória cognitiva para agentes IA. Código aberto. Gratuito. Criado pela equipe WAzion.
AGPL-3.0 License • npm • Site oficial • GitHub
Por que o criamos
Construir WAzion como uma só pessoa significava trabalhar com agentes de IA todos os dias. Mas toda vez que você encerrava uma sessão, o agente esquecia tudo. As mesmas correções, os mesmos erros, começar do zero todas as manhãs.
Precisávamos de um agente que lembrasse. Que aprendesse com seus erros. Que detectasse quando estava prestes a repetir algo que já havia falhado antes. Que mantivesse continuidade entre as sessões como se fosse a mesma pessoa.
Assim nasceu o NEXO Brain: um sistema de memória cognitiva modelado de acordo com o funcionamento da memória humana.
Como funciona
NEXO Brain implementa o modelo de memória Atkinson-Shiffrin da psicologia cognitiva, o mesmo modelo que explica como funciona a memória humana:
Registro Sensorial
Capture tudo o que acontece na sessão. Descarte o ruído em 30 segundos. Somente o relevante passa para o próximo nível.
Memória de Curto Prazo
Mantém o contexto ativo de trabalho. Com o ensaio (uso repetido), as memórias são reforçadas. Sem uso, degradam-se naturalmente seguindo a curva de Ebbinghaus.
Memória de Longo Prazo
Vetores semânticos pesquisáveis por significado. As memórias semelhantes se fundem de forma discriminativa: conservam o que difere, unem o que se sobrepõe. Permanente.
O que inclui
Mais de 100 ferramentas MCP
Sessões, memória, aprendizado, credenciais, guardar, preferências, entidades, diário episódico e mais. Tudo exposto como ferramentas MCP, extensível via plugins.
Busca semântica RAG
Vetores com fastembed (768 dimensões). Busca híbrida semântica + BM25, reranking por cross-encoder e multi-query. Resultados relevantes em milissegundos.
Pontuação de Confiança
Índice de alinhamento 0-100 que reflete a qualidade do trabalho do agente. As correções o diminuem, os acertos o aumentam. Controla o rigor interno.
Guarda metacognitivo
Antes de editar código, o guard injetar erros conhecidos, schemas reais e regras de bloqueio. Evita repetir erros do passado.
Dissonância cognitiva
Detecta quando uma nova instrução contradiz uma memória forte. Em vez de sobrescrever em silêncio, pergunte.
100% local
Tudo em SQLite local. Os vetores são computados na sua máquina com ONNX Runtime. Nada sai do seu computador. Zero dependências em nuvem.
Gráfico de Conhecimento
Grafo bi-temporal de entidades e relações. Consultas temporais, percurso BFS, deduplicação inteligente com event-sourcing e visualização interativa D3.js.
Painel da Web
Interface visual com 6 páginas: Visão Geral, Grafo, Memória, Somático, Adaptativo e Sessões. FastAPI + D3.js em localhost:6174. Veja o cérebro do seu agente em tempo real.
Multiplataforma
Suporte completo para Linux e Windows. O instalador detecta a plataforma e configura o gerenciador de processos adequado. Manutenção oportuna quando há recursos disponíveis.
Continuidade de Contexto
Auto-compactação inteligente do contexto de sessão. Quando o contexto está no limite, NEXO Brain consolida automaticamente o histórico ativo em um resumo semântico sem perder o fio do trabalho.
Benchmarks reais
Medido sobre o sistema cognitivo real da NEXO. Sem dataset sintético, sem laboratório — produção real.
Busca híbrida
Combina busca vetorial semântica com BM25 (frequência de termos). Encontra memórias tanto por significado quanto por palavras-chave exatas.
Reclassificação de cross-encoder
Depois de recuperar candidatos, um segundo modelo os reordena por relevância real com a consulta. Os resultados corretos sobem, o ruído diminui.
Expansão de múltiplas consultas
Uma única pergunta gera múltiplas variações de busca automaticamente. Captura memórias relevantes mesmo que estejam formuladas de forma diferente.
Chunking inteligente
As memórias longas são divididas em fragmentos com sobreposição. Cada fragmento é recuperável de forma independente sem perder o contexto.
Resumos de sessão
Resumos automáticos de sessões anteriores indexados como memórias. O agente recupera o fio das conversas passadas sem reler todos os logs.
768 dimensões
Embeddings de 768 dimensões (era 384). Maior capacidade semântica, melhor discriminação entre conceitos parecidos, sem aumentar dependências externas.
Memória episódica
Diário de sessão, registro de mudanças, registro de decisões e recall semântico. O agente sabe o que fez, por que fez e com qual resultado.
Síntese diária e semanal
Resumo automático de padrões, erros recorrentes e pontos de melhoria. O agente aprende entre as sessões, não apenas dentro delas.
Detecção de sentimento
Análise automática do tom do usuário em cada interação. O agente ajusta seu comportamento de acordo com o estado emocional detectado.
Resolução de dissonância
Quando uma nova instrução contradiz uma memória forte, o agente a detecta, a verbaliza e pergunta antes de sobrescrever.
Guarda metacognitivo
Antes de editar o código, o guard injetar erros conhecidos e regras de bloqueio. Taxa de erro repetido alvo: <15%. 93,3% de rejeição adversarial.
Trust Score adaptativo
Índice de alinhamento que ajusta o rigor interno do agente. Pontuação alta = modo fluido. Pontuação baixa = mais verificações e precaução.
Fusão discriminativa de memórias
Memórias semelhantes se fundem preservando o que difere. Evita duplicados e reduz o ruído cognitivo sem perder nuances.
Decaimento adaptativo Ebbinghaus
As memórias não usadas se degradam seguindo a curva do esquecimento humano. A repetição as reforça. Somente o relevante sobrevive.
Plugin de recarga a quente
Adicione ou elimine capacidades em tempo de execução sem reiniciar o servidor MCP. Arquitetura extensível por design.
Indexação temporal
As memórias são indexadas com marcas de tempo para permitir buscas por intervalo temporal. Recupera o que aconteceu em uma semana específica ou nos últimos N dias.
Pesos Aprendidos
Os pesos dos sinais aprendem do feedback real via regressão Ridge. Modo sombra, momentum, auto-rollback.
Marcadores Somáticos
Memória de dor por arquivo e área. O guardião alerta em arquivos ALTO RISCO e CRÍTICO. Recuperação validada.
Personalidade de 6 sinais
Vibe, correções, brevidade, tema, erros de ferramentas, git diff. Bypass de emergência. Decaimento de severidade.
Auto-migração
Migração automática de bases de dados cognitivas anteriores para o novo esquema de 768 dimensões. Sem perda de dados nem intervenção manual.
SQLite seguro para threads
Escritas serializadas, testadas sob estresse a 100%. Sem corrupções sob carga concorrente.
Multiplataforma (Linux + Windows)
Instalação idêntica no macOS, Linux e Windows. O mesmo servidor MCP, o mesmo banco de dados cognitivo, sem adaptações manuais.
Sistema imunológico (disjuntores + vigilante)
Disjuntores cortam operações falhadas antes que se propaguem. O watchdog reinicia processos caídos. O agente se recupera sozinho sem intervenção humana.
Motor de reflexão
Antes de agir, o agente verifica erros anteriores, esquemas reais e regras de bloqueio. Depois registra a mudança e cria follow-ups de verificação. Ciclo completo de autoverificação.
Evolução semanal automática
A cada semana, o sistema analisa seus próprios padrões de erro, propõe melhorias às suas regras e as aplica se forem aprovadas. O agente melhora seu comportamento entre as sessões sem intervenção manual.
Orquestração completa (5 ganchos)
5 hooks do ciclo de sessão: SessionStart, PreToolCall, PostToolCall, Stop, SubagentStop. Cada hook dispara memória, heartbeat, guard e briefing diário de forma automática.
Instalação
Um comando. 60 segundos. Seu agente tem memória.
Requer um Python 3.10+ e Claude Code. O instalador configura tudo automaticamente: servidor MCP, bancos de dados, processos de manutenção cognitiva.
Código aberto para todos
NEXO Brain é open source sob licença AGPL-3.0. Nós o disponibilizamos para qualquer desenvolvedor, equipe ou empresa que queira dar memória real aos seus agentes de IA.