NEXO Brain
Memoria cognitiva per agenti IA. Codice aperto. Gratuito. Creato dal team WAzion.
AGPL-3.0 License • npm • Sito ufficiale • GitHub
Perché lo abbiamo creato
Costruire WAzion come una sola persona significava lavorare con agenti IA ogni giorno. Ma ogni volta che chiudevi una sessione, l’agente dimenticava tutto. Le stesse correzioni, gli stessi errori, ricominciare da zero ogni mattina.
Avevamo bisogno di un agente che ricordasse. Che imparasse dai suoi errori. Che rilevasse quando stava per ripetere qualcosa che aveva già fallito in precedenza. Che mantenesse continuità tra le sessioni come se fosse la stessa persona.
Così è nato NEXO Brain: un sistema di memoria cognitiva modellato secondo il funzionamento della memoria umana.
Come funziona
NEXO Brain implementa il modello di memoria Atkinson-Shiffrin della psicologia cognitiva, lo stesso modello che spiega come funziona la memoria umana:
Registro Sensoriale
Cattura tutto ciò che accade nella sessione. Scarta il rumore in 30 secondi. Solo ciò che è rilevante passa al livello successivo.
Memoria a Breve Termine
Mantiene il contesto attivo di lavoro. Con il rehearsal (uso ripetuto), le memorie si rafforzano. Senza uso, si degradano naturalmente seguendo la curva di Ebbinghaus.
Memoria a Lungo Termine
Vettori semantici ricercabili per significato. Le memorie simili si fondono in modo discriminativo: conservano ciò che differisce, uniscono ciò che si sovrappone. Permanente.
Cosa include
Oltre 100 strumenti MCP
Sessioni, memoria, apprendimento, credenziali, guard, preferenze, entità, diario episodico e altro. Tutto esposto come strumenti MCP, estensibile tramite plugin.
Ricerca semantica RAG
Vettori con fastembed (768 dimensioni). Ricerca ibrida semantica + BM25, riordino tramite cross-encoder e multi-query. Risultati rilevanti in millisecondi.
Punteggio di fiducia
Indice di allineamento 0-100 che riflette la qualità del lavoro dell’agente. Le correzioni lo abbassano, i successi lo alzano. Controlla il rigore interno.
Guardia metacognitiva
Prima di modificare il codice, il guard inietta errori noti, schemi reali e regole di blocco. Evita di ripetere errori del passato.
Dissonanza cognitiva
Rileva quando una nuova istruzione contraddice una memoria forte. Invece di sovrascrivere in silenzio, chiedi.
100% locale
Tutto in SQLite locale. I vettori vengono calcolati sul tuo computer con ONNX Runtime. Niente esce dal tuo computer. Zero dipendenze cloud.
Grafico della conoscenza
Grafo bi-temporale di entità e relazioni. Query temporali, percorso BFS, deduplicazione intelligente con event-sourcing e visualizzazione interattiva D3.js.
Pannello di controllo web
Interfaccia visiva con 6 pagine: Panoramica, Grafo, Memoria, Somatico, Adattivo e Sessioni. FastAPI + D3.js su localhost:6174. Guarda il cervello del tuo agente in tempo reale.
Multiplatforma
Supporto completo per Linux e Windows. L’installer rileva la piattaforma e configura il gestore di processi adeguato. Manutenzione opportunistica quando ci sono risorse disponibili.
Continuità del contesto
Auto-compattazione intelligente del contesto di sessione. Quando il contesto è al limite, NEXO Brain consolida automaticamente la cronologia attiva in un riassunto semantico senza perdere il filo del lavoro.
Benchmark reali
Misurato sul sistema cognitivo reale di NEXO. Senza dataset sintetico, senza laboratorio — produzione reale.
Ricerca ibrida
Combina ricerca vettoriale semantica con BM25 (frequenza dei termini). Trova memorie sia per significato che per parole chiave esatte.
Cross-encoder reranking
Dopo aver recuperato i candidati, un secondo modello li riordina per rilevanza reale rispetto alla query. I risultati corretti salgono, il rumore scende.
Espansione multi-query
Una sola domanda genera automaticamente molte variazioni di ricerca. Cattura memorie rilevanti anche se formulate in modo diverso.
Chunking intelligente
I ricordi lunghi si dividono in frammenti sovrapposti. Ogni frammento è recuperabile in modo indipendente senza perdere il contesto.
Riepiloghi delle sessioni
Riepiloghi automatici delle sessioni precedenti indicizzati come memorie. L’agente recupera il filo delle conversazioni passate senza rileggere tutti i log.
768 dimensioni
Embeddings di 768 dimensioni (era 384). Maggiore capacità semantica, migliore discriminazione tra concetti simili, senza aumentare le dipendenze esterne.
Memoria episodica
Diario di sessione, registro delle modifiche, registro delle decisioni e richiamo semantico. L’agente sa cosa ha fatto, perché e con quale risultato.
Sintesi giornaliera e settimanale
Riepilogo automatico di modelli, errori ricorrenti e punti di miglioramento. L’agente impara tra le sessioni, non solo all’interno di esse.
Rilevamento del sentimento
Analisi automatica del tono dell’utente in ogni interazione. L’agente adatta il suo comportamento in base allo stato emotivo rilevato.
Risoluzione della dissonanza
Quando una nuova istruzione contraddice una memoria forte, l’agente la rileva, la verbalizza e chiede prima di sovrascrivere.
Guardia metacognitiva
Prima di modificare il codice, il guard inietta errori noti e regole di blocco. Tasso di errore ripetuto obiettivo: <15%. 93,3% di rifiuto avversariale.
Trust Score adattivo
Indice di allineamento che regola la severità interna dell’agente. Punteggio alto = modalità fluida. Punteggio basso = più verifiche e cautela.
Fusione discriminativa di memorie
Memorie simili si fondono preservando ciò che differisce. Evita duplicati e riduce il rumore cognitivo senza perdere sfumature.
Decadimento adattivo di Ebbinghaus
Le memorie non utilizzate si degradano seguendo la curva dell’oblio umano. Il ripasso le rinforza. Sopravvive solo ciò che è rilevante.
Plugin hot-reload
Aggiungi o rimuovi capacità in tempo reale senza riavviare il server MCP. Architettura estensibile per design.
Indicizzazione temporale
Le memorie vengono indicizzate con marchi temporali per consentire ricerche per intervallo temporale. Recupera ciò che è accaduto in una settimana specifica o negli ultimi N giorni.
Pesi appresi
I pesi dei segnali apprendono dal feedback reale tramite regressione Ridge. Modalità ombra, momentum, auto-rollback.
Marcatori somatici
Memoria di dolore per archivio e area. Il guardiano avverte in archivi HIGH RISK e CRITICAL. Recupero convalidato.
Personalità di 6 segnali
Vibe, correzioni, brevità, tema, errori degli strumenti, git diff. Bypass di emergenza. Decadimento di severità.
Auto-migrazione
Migrazione automatica di database cognitivi precedenti al nuovo schema di 768 dimensioni. Senza perdita di dati né intervento manuale.
SQLite thread-safe
Scritture serializzate, testate al 100% per stress. Senza corruzioni sotto carico concorrente.
Cross-platform (Linux + Windows)
Installazione identica su macOS, Linux e Windows. Lo stesso server MCP, lo stesso database cognitivo, senza adattamenti manuali.
Sistema immunitario (interruttori di circuito + cane da guardia)
I interruttori automatici interrompono le operazioni fallite prima che si propagino. Il watchdog riavvia i processi bloccati. L’agente si riprende da solo senza intervento umano.
Motore di riflessione
Prima di agire, l’agente verifica errori precedenti, schemi reali e regole di blocco. Dopo registra la modifica e crea follow-up di verifica. Ciclo completo di autoverifica.
Evoluzione settimanale automatica
Ogni settimana il sistema analizza i propri schemi di errore, propone miglioramenti alle proprie regole e li applica se vengono approvati. L’agente migliora il proprio comportamento tra le sessioni senza intervento manuale.
Orchestrazione completa (5 hook)
5 hook del ciclo di sessione: SessionStart, PreToolCall, PostToolCall, Stop, SubagentStop. Ogni hook attiva automaticamente memoria, heartbeat, guard e briefing giornaliero.
Installazione
Un comando. 60 secondi. Il tuo agente ha memoria.
Richiede Python 3.10+ e Claude Code. L’installer configura tutto automaticamente: server MCP, database, processi di manutenzione cognitiva.
Codice aperto per tutti
NEXO Brain è open source sotto licenza AGPL-3.0. Lo mettiamo a disposizione di qualsiasi sviluppatore, team o azienda che voglia dare memoria reale ai propri agenti IA.