NEXO Brain

NEXO Brain

Memoria cognitiva per agenti IA. Codice aperto. Gratuito. Creato dal team WAzion.

AGPL-3.0 License • npm • Sito ufficialeGitHub

npm version GitHub stars npm downloads

Perché lo abbiamo creato

Costruire WAzion come una sola persona significava lavorare con agenti IA ogni giorno. Ma ogni volta che chiudevi una sessione, l’agente dimenticava tutto. Le stesse correzioni, gli stessi errori, ricominciare da zero ogni mattina.

Avevamo bisogno di un agente che ricordasse. Che imparasse dai suoi errori. Che rilevasse quando stava per ripetere qualcosa che aveva già fallito in precedenza. Che mantenesse continuità tra le sessioni come se fosse la stessa persona.

Così è nato NEXO Brain: un sistema di memoria cognitiva modellato secondo il funzionamento della memoria umana.

Come funziona

NEXO Brain implementa il modello di memoria Atkinson-Shiffrin della psicologia cognitiva, lo stesso modello che spiega come funziona la memoria umana:

Registro Sensoriale

Cattura tutto ciò che accade nella sessione. Scarta il rumore in 30 secondi. Solo ciò che è rilevante passa al livello successivo.

Memoria a Breve Termine

Mantiene il contesto attivo di lavoro. Con il rehearsal (uso ripetuto), le memorie si rafforzano. Senza uso, si degradano naturalmente seguendo la curva di Ebbinghaus.

Memoria a Lungo Termine

Vettori semantici ricercabili per significato. Le memorie simili si fondono in modo discriminativo: conservano ciò che differisce, uniscono ciò che si sovrappone. Permanente.

Cosa include

Oltre 100 strumenti MCP

Sessioni, memoria, apprendimento, credenziali, guard, preferenze, entità, diario episodico e altro. Tutto esposto come strumenti MCP, estensibile tramite plugin.

Ricerca semantica RAG

Vettori con fastembed (768 dimensioni). Ricerca ibrida semantica + BM25, riordino tramite cross-encoder e multi-query. Risultati rilevanti in millisecondi.

Punteggio di fiducia

Indice di allineamento 0-100 che riflette la qualità del lavoro dell’agente. Le correzioni lo abbassano, i successi lo alzano. Controlla il rigore interno.

Guardia metacognitiva

Prima di modificare il codice, il guard inietta errori noti, schemi reali e regole di blocco. Evita di ripetere errori del passato.

Dissonanza cognitiva

Rileva quando una nuova istruzione contraddice una memoria forte. Invece di sovrascrivere in silenzio, chiedi.

100% locale

Tutto in SQLite locale. I vettori vengono calcolati sul tuo computer con ONNX Runtime. Niente esce dal tuo computer. Zero dipendenze cloud.

Grafico della conoscenza

Grafo bi-temporale di entità e relazioni. Query temporali, percorso BFS, deduplicazione intelligente con event-sourcing e visualizzazione interattiva D3.js.

Pannello di controllo web

Interfaccia visiva con 6 pagine: Panoramica, Grafo, Memoria, Somatico, Adattivo e Sessioni. FastAPI + D3.js su localhost:6174. Guarda il cervello del tuo agente in tempo reale.

Multiplatforma

Supporto completo per Linux e Windows. L’installer rileva la piattaforma e configura il gestore di processi adeguato. Manutenzione opportunistica quando ci sono risorse disponibili.

Continuità del contesto

Auto-compattazione intelligente del contesto di sessione. Quando il contesto è al limite, NEXO Brain consolida automaticamente la cronologia attiva in un riassunto semantico senza perdere il filo del lavoro.

Benchmark reali

Misurato sul sistema cognitivo reale di NEXO. Senza dataset sintetico, senza laboratorio — produzione reale.

0.588
F1 Score RAG
Precisione nel recupero di memorie rilevanti
+55%
vs GPT-4
Miglioramento nella rilevanza del recupero semantico
93.3%
Rifiuto avversariale
Istruzioni malevole bloccate dal guardiano

Ricerca ibrida

Combina ricerca vettoriale semantica con BM25 (frequenza dei termini). Trova memorie sia per significato che per parole chiave esatte.

Cross-encoder reranking

Dopo aver recuperato i candidati, un secondo modello li riordina per rilevanza reale rispetto alla query. I risultati corretti salgono, il rumore scende.

Espansione multi-query

Una sola domanda genera automaticamente molte variazioni di ricerca. Cattura memorie rilevanti anche se formulate in modo diverso.

Chunking intelligente

I ricordi lunghi si dividono in frammenti sovrapposti. Ogni frammento è recuperabile in modo indipendente senza perdere il contesto.

Riepiloghi delle sessioni

Riepiloghi automatici delle sessioni precedenti indicizzati come memorie. L’agente recupera il filo delle conversazioni passate senza rileggere tutti i log.

768 dimensioni

Embeddings di 768 dimensioni (era 384). Maggiore capacità semantica, migliore discriminazione tra concetti simili, senza aumentare le dipendenze esterne.

Memoria episodica

Diario di sessione, registro delle modifiche, registro delle decisioni e richiamo semantico. L’agente sa cosa ha fatto, perché e con quale risultato.

Sintesi giornaliera e settimanale

Riepilogo automatico di modelli, errori ricorrenti e punti di miglioramento. L’agente impara tra le sessioni, non solo all’interno di esse.

Rilevamento del sentimento

Analisi automatica del tono dell’utente in ogni interazione. L’agente adatta il suo comportamento in base allo stato emotivo rilevato.

Risoluzione della dissonanza

Quando una nuova istruzione contraddice una memoria forte, l’agente la rileva, la verbalizza e chiede prima di sovrascrivere.

Guardia metacognitiva

Prima di modificare il codice, il guard inietta errori noti e regole di blocco. Tasso di errore ripetuto obiettivo: <15%. 93,3% di rifiuto avversariale.

Trust Score adattivo

Indice di allineamento che regola la severità interna dell’agente. Punteggio alto = modalità fluida. Punteggio basso = più verifiche e cautela.

Fusione discriminativa di memorie

Memorie simili si fondono preservando ciò che differisce. Evita duplicati e riduce il rumore cognitivo senza perdere sfumature.

Decadimento adattivo di Ebbinghaus

Le memorie non utilizzate si degradano seguendo la curva dell’oblio umano. Il ripasso le rinforza. Sopravvive solo ciò che è rilevante.

Plugin hot-reload

Aggiungi o rimuovi capacità in tempo reale senza riavviare il server MCP. Architettura estensibile per design.

Indicizzazione temporale

Le memorie vengono indicizzate con marchi temporali per consentire ricerche per intervallo temporale. Recupera ciò che è accaduto in una settimana specifica o negli ultimi N giorni.

Pesi appresi

I pesi dei segnali apprendono dal feedback reale tramite regressione Ridge. Modalità ombra, momentum, auto-rollback.

Marcatori somatici

Memoria di dolore per archivio e area. Il guardiano avverte in archivi HIGH RISK e CRITICAL. Recupero convalidato.

Personalità di 6 segnali

Vibe, correzioni, brevità, tema, errori degli strumenti, git diff. Bypass di emergenza. Decadimento di severità.

Auto-migrazione

Migrazione automatica di database cognitivi precedenti al nuovo schema di 768 dimensioni. Senza perdita di dati né intervento manuale.

SQLite thread-safe

Scritture serializzate, testate al 100% per stress. Senza corruzioni sotto carico concorrente.

Cross-platform (Linux + Windows)

Installazione identica su macOS, Linux e Windows. Lo stesso server MCP, lo stesso database cognitivo, senza adattamenti manuali.

Sistema immunitario (interruttori di circuito + cane da guardia)

I interruttori automatici interrompono le operazioni fallite prima che si propagino. Il watchdog riavvia i processi bloccati. L’agente si riprende da solo senza intervento umano.

Motore di riflessione

Prima di agire, l’agente verifica errori precedenti, schemi reali e regole di blocco. Dopo registra la modifica e crea follow-up di verifica. Ciclo completo di autoverifica.

Evoluzione settimanale automatica

Ogni settimana il sistema analizza i propri schemi di errore, propone miglioramenti alle proprie regole e li applica se vengono approvati. L’agente migliora il proprio comportamento tra le sessioni senza intervento manuale.

Orchestrazione completa (5 hook)

5 hook del ciclo di sessione: SessionStart, PreToolCall, PostToolCall, Stop, SubagentStop. Ogni hook attiva automaticamente memoria, heartbeat, guard e briefing giornaliero.

Installazione

Un comando. 60 secondi. Il tuo agente ha memoria.

$ npx nexo-brain init

Richiede Python 3.10+ e Claude Code. L’installer configura tutto automaticamente: server MCP, database, processi di manutenzione cognitiva.

Codice aperto per tutti

NEXO Brain è open source sotto licenza AGPL-3.0. Lo mettiamo a disposizione di qualsiasi sviluppatore, team o azienda che voglia dare memoria reale ai propri agenti IA.

Assistente WAzion

Informazioni commerciali e supporto tecnico

Ciao! Sono l’assistente di WAzion. Posso aiutarti con informazioni su prezzi e piani, dubbi tecnici, configurazione o qualsiasi domanda sul nostro prodotto. Come posso aiutarti?
Sviluppato con WAzion AI