NEXO Brain

NEXO Brain

Memória cognitiva para agentes IA. Código aberto. Gratuito. Criado pela equipe WAzion.

AGPL-3.0 License • npm • Site oficialGitHub

npm version GitHub stars npm downloads

Por que o criamos

Construir WAzion como uma só pessoa significava trabalhar com agentes de IA todos os dias. Mas toda vez que você encerrava uma sessão, o agente esquecia tudo. As mesmas correções, os mesmos erros, começar do zero todas as manhãs.

Precisávamos de um agente que lembrasse. Que aprendesse com seus erros. Que detectasse quando estava prestes a repetir algo que já havia falhado antes. Que mantivesse continuidade entre as sessões como se fosse a mesma pessoa.

Assim nasceu o NEXO Brain: um sistema de memória cognitiva modelado de acordo com o funcionamento da memória humana.

Como funciona

NEXO Brain implementa o modelo de memória Atkinson-Shiffrin da psicologia cognitiva, o mesmo modelo que explica como funciona a memória humana:

Registro Sensorial

Capture tudo o que acontece na sessão. Descarte o ruído em 30 segundos. Somente o relevante passa para o próximo nível.

Memória de Curto Prazo

Mantém o contexto ativo de trabalho. Com o ensaio (uso repetido), as memórias são reforçadas. Sem uso, degradam-se naturalmente seguindo a curva de Ebbinghaus.

Memória de Longo Prazo

Vetores semânticos pesquisáveis por significado. As memórias semelhantes se fundem de forma discriminativa: conservam o que difere, unem o que se sobrepõe. Permanente.

O que inclui

Mais de 100 ferramentas MCP

Sessões, memória, aprendizado, credenciais, guardar, preferências, entidades, diário episódico e mais. Tudo exposto como ferramentas MCP, extensível via plugins.

Busca semântica RAG

Vetores com fastembed (768 dimensões). Busca híbrida semântica + BM25, reranking por cross-encoder e multi-query. Resultados relevantes em milissegundos.

Pontuação de Confiança

Índice de alinhamento 0-100 que reflete a qualidade do trabalho do agente. As correções o diminuem, os acertos o aumentam. Controla o rigor interno.

Guarda metacognitivo

Antes de editar código, o guard injetar erros conhecidos, schemas reais e regras de bloqueio. Evita repetir erros do passado.

Dissonância cognitiva

Detecta quando uma nova instrução contradiz uma memória forte. Em vez de sobrescrever em silêncio, pergunte.

100% local

Tudo em SQLite local. Os vetores são computados na sua máquina com ONNX Runtime. Nada sai do seu computador. Zero dependências em nuvem.

Gráfico de Conhecimento

Grafo bi-temporal de entidades e relações. Consultas temporais, percurso BFS, deduplicação inteligente com event-sourcing e visualização interativa D3.js.

Painel da Web

Interface visual com 6 páginas: Visão Geral, Grafo, Memória, Somático, Adaptativo e Sessões. FastAPI + D3.js em localhost:6174. Veja o cérebro do seu agente em tempo real.

Multiplataforma

Suporte completo para Linux e Windows. O instalador detecta a plataforma e configura o gerenciador de processos adequado. Manutenção oportuna quando há recursos disponíveis.

Continuidade de Contexto

Auto-compactação inteligente do contexto de sessão. Quando o contexto está no limite, NEXO Brain consolida automaticamente o histórico ativo em um resumo semântico sem perder o fio do trabalho.

Benchmarks reais

Medido sobre o sistema cognitivo real da NEXO. Sem dataset sintético, sem laboratório — produção real.

0.588
F1 Score RAG
Precisão de recuperação de memórias relevantes
+55%
vs GPT-4
Melhora na relevância da recuperação semântica
93.3%
Rejeição adversarial
Instruções maliciosas bloqueadas pelo guardião

Busca híbrida

Combina busca vetorial semântica com BM25 (frequência de termos). Encontra memórias tanto por significado quanto por palavras-chave exatas.

Reclassificação de cross-encoder

Depois de recuperar candidatos, um segundo modelo os reordena por relevância real com a consulta. Os resultados corretos sobem, o ruído diminui.

Expansão de múltiplas consultas

Uma única pergunta gera múltiplas variações de busca automaticamente. Captura memórias relevantes mesmo que estejam formuladas de forma diferente.

Chunking inteligente

As memórias longas são divididas em fragmentos com sobreposição. Cada fragmento é recuperável de forma independente sem perder o contexto.

Resumos de sessão

Resumos automáticos de sessões anteriores indexados como memórias. O agente recupera o fio das conversas passadas sem reler todos os logs.

768 dimensões

Embeddings de 768 dimensões (era 384). Maior capacidade semântica, melhor discriminação entre conceitos parecidos, sem aumentar dependências externas.

Memória episódica

Diário de sessão, registro de mudanças, registro de decisões e recall semântico. O agente sabe o que fez, por que fez e com qual resultado.

Síntese diária e semanal

Resumo automático de padrões, erros recorrentes e pontos de melhoria. O agente aprende entre as sessões, não apenas dentro delas.

Detecção de sentimento

Análise automática do tom do usuário em cada interação. O agente ajusta seu comportamento de acordo com o estado emocional detectado.

Resolução de dissonância

Quando uma nova instrução contradiz uma memória forte, o agente a detecta, a verbaliza e pergunta antes de sobrescrever.

Guarda metacognitivo

Antes de editar o código, o guard injetar erros conhecidos e regras de bloqueio. Taxa de erro repetido alvo: <15%. 93,3% de rejeição adversarial.

Trust Score adaptativo

Índice de alinhamento que ajusta o rigor interno do agente. Pontuação alta = modo fluido. Pontuação baixa = mais verificações e precaução.

Fusão discriminativa de memórias

Memórias semelhantes se fundem preservando o que difere. Evita duplicados e reduz o ruído cognitivo sem perder nuances.

Decaimento adaptativo Ebbinghaus

As memórias não usadas se degradam seguindo a curva do esquecimento humano. A repetição as reforça. Somente o relevante sobrevive.

Plugin de recarga a quente

Adicione ou elimine capacidades em tempo de execução sem reiniciar o servidor MCP. Arquitetura extensível por design.

Indexação temporal

As memórias são indexadas com marcas de tempo para permitir buscas por intervalo temporal. Recupera o que aconteceu em uma semana específica ou nos últimos N dias.

Pesos Aprendidos

Os pesos dos sinais aprendem do feedback real via regressão Ridge. Modo sombra, momentum, auto-rollback.

Marcadores Somáticos

Memória de dor por arquivo e área. O guardião alerta em arquivos ALTO RISCO e CRÍTICO. Recuperação validada.

Personalidade de 6 sinais

Vibe, correções, brevidade, tema, erros de ferramentas, git diff. Bypass de emergência. Decaimento de severidade.

Auto-migração

Migração automática de bases de dados cognitivas anteriores para o novo esquema de 768 dimensões. Sem perda de dados nem intervenção manual.

SQLite seguro para threads

Escritas serializadas, testadas sob estresse a 100%. Sem corrupções sob carga concorrente.

Multiplataforma (Linux + Windows)

Instalação idêntica no macOS, Linux e Windows. O mesmo servidor MCP, o mesmo banco de dados cognitivo, sem adaptações manuais.

Sistema imunológico (disjuntores + vigilante)

Disjuntores cortam operações falhadas antes que se propaguem. O watchdog reinicia processos caídos. O agente se recupera sozinho sem intervenção humana.

Motor de reflexão

Antes de agir, o agente verifica erros anteriores, esquemas reais e regras de bloqueio. Depois registra a mudança e cria follow-ups de verificação. Ciclo completo de autoverificação.

Evolução semanal automática

A cada semana, o sistema analisa seus próprios padrões de erro, propõe melhorias às suas regras e as aplica se forem aprovadas. O agente melhora seu comportamento entre as sessões sem intervenção manual.

Orquestração completa (5 ganchos)

5 hooks do ciclo de sessão: SessionStart, PreToolCall, PostToolCall, Stop, SubagentStop. Cada hook dispara memória, heartbeat, guard e briefing diário de forma automática.

Instalação

Um comando. 60 segundos. Seu agente tem memória.

$ npx nexo-brain init

Requer um Python 3.10+ e Claude Code. O instalador configura tudo automaticamente: servidor MCP, bancos de dados, processos de manutenção cognitiva.

Código aberto para todos

NEXO Brain é open source sob licença AGPL-3.0. Nós o disponibilizamos para qualquer desenvolvedor, equipe ou empresa que queira dar memória real aos seus agentes de IA.

Assistente WAzion

Informações comerciais e suporte técnico

Olá! Sou o assistente da WAzion. Posso ajudá-lo com informações sobre preços e planos, dúvidas técnicas, configuração ou qualquer pergunta sobre o nosso produto. Como posso ajudá-lo?
Desenvolvido com WAzion AI