NEXO Brain

NEXO Brain

Mémoire cognitive pour agents IA. Code ouvert. Gratuit. Créé par l’équipe WAzion.

AGPL-3.0 License • npm • Site officielGitHub

npm version GitHub stars npm downloads

Pourquoi nous l’avons créé

Construire WAzion en tant qu’une seule personne signifiait travailler avec des agents IA tous les jours. Mais chaque fois que vous fermiez une session, l’agent oubliait tout. Les mêmes corrections, les mêmes erreurs, recommencer à zéro chaque matin.

Nous avions besoin d’un agent qui se souvienne. Qui apprenne de ses erreurs. Qui détecte quand il est sur le point de répéter quelque chose qui avait déjà échoué auparavant. Qui maintienne une continuité entre les sessions comme s’il s’agissait de la même personne.

Ainsi est né NEXO Brain : un système de mémoire cognitive modelé selon le fonctionnement de la mémoire humaine.

Comment ça marche

NEXO Brain met en œuvre le modèle de mémoire d’Atkinson-Shiffrin de la psychologie cognitive, le même modèle qui explique comment fonctionne la mémoire humaine :

Enregistrement Sensoriel

Capture tout ce qui se passe dans la session. Éliminez le bruit en 30 secondes. Seules les informations pertinentes passent au niveau suivant.

Mémoire à Court Terme

Il maintient le contexte actif de travail. Avec le rehearsal (usage répété), les mémoires se renforcent. Sans usage, elles se dégradent naturellement selon la courbe d’Ebbinghaus.

Mémoire à Long Terme

Vecteurs sémantiques recherchables par signification. Les mémoires similaires se fusionnent de manière discriminative : elles conservent ce qui diffère, unissent ce qui se chevauche. Permanent.

Qu’est-ce qui est inclus

Plus de 100 outils MCP

Sessions, mémoire, apprentissage, identifiants, garde, préférences, entités, journal épistolaire et plus. Tout exposé comme outils MCP, extensible via des plugins.

Recherche sémantique RAG

Vecteurs avec fastembed (768 dimensions). Recherche hybride sémantique + BM25, reranking par cross-encoder et multi-query. Résultats pertinents en millisecondes.

Score de confiance

Indice d’alignement 0-100 qui reflète la qualité du travail de l’agent. Les corrections le font baisser, les réussites le font monter. Contrôle le rigueur interne.

Garde métacognitive

Avant d’éditer le code, le gardien injecte des erreurs connues, des schémas réels et des règles de blocage. Il évite de répéter les erreurs du passé.

Dissonance cognitive

Détecte quand une nouvelle instruction contredit une mémoire forte. Au lieu de réécrire en silence, demande.

100% local

Tout en SQLite local. Les vecteurs sont calculés sur votre machine avec ONNX Runtime. Rien ne sort de votre ordinateur. Zéro dépendances cloud.

Graph de connaissances

Graphe bi-temporel d’entités et de relations. Requêtes temporelles, parcours BFS, dé-duplication intelligente avec event-sourcing, et visualisation interactive D3.js.

Tableau de bord Web

Interface visuelle avec 6 pages : Aperçu, Graphe, Mémoire, Somatique, Adaptatif et Sessions. FastAPI + D3.js sur localhost:6174. Voyez le cerveau de votre agent en temps réel.

Multiplateforme

Support complet pour Linux et Windows. L’installateur détecte la plateforme et configure le gestionnaire de processus approprié. Maintenance opportuniste lorsque des ressources sont disponibles.

Continuité du contexte

Auto-compactage intelligent du contexte de session. Lorsque le contexte est à la limite, NEXO Brain consolide automatiquement l’historique actif en un résumé sémantique sans perdre le fil du travail.

Références réelles

Mesuré sur le système cognitif réel de NEXO. Sans jeu de données synthétique, sans laboratoire — production réelle.

0.588
Score F1 RAG
Précision de récupération des mémoires pertinentes
+55%
vs GPT-4
Amélioration de la pertinence de la récupération sémantique
93.3%
Rejet adversarial
Instructions malveillantes bloquées par le garde

Recherche hybride

Combine la recherche vectorielle sémantique avec BM25 (fréquence des termes). Trouvez des mémoires à la fois par signification et par mots-clés exacts.

Réévaluation par cross-encoder

Après avoir récupéré des candidats, un deuxième modèle les réorganise par pertinence réelle avec la requête. Les résultats corrects montent, le bruit diminue.

Expansion multi-requêtes

Une seule question génère automatiquement de multiples variations de recherche. Elle capture des mémoires pertinentes même si elles sont formulées différemment.

Chunking intelligent

Les souvenirs longs se divisent en fragments avec chevauchement. Chaque fragment est récupérable de manière indépendante sans perdre le contexte.

Résumés de session

Résumé automatiques des sessions précédentes indexés comme mémoires. L’agent récupère le fil des conversations passées sans relire tous les journaux.

768 dimensions

Embeddings de 768 dimensions (était 384). Plus grande capacité sémantique, meilleure discrimination entre concepts similaires, sans augmenter les dépendances externes.

Mémoire épisodique

Journal de session, journal des modifications, journal des décisions et rappel sémantique. L’agent sait ce qu’il a fait, pourquoi et avec quel résultat.

Synthèse quotidienne et hebdomadaire

Résumé automatique des motifs, erreurs récurrentes et points d’amélioration. L’agent apprend entre les sessions, pas seulement à l’intérieur de celles-ci.

Détection de sentiment

Analyse automatique du ton de l’utilisateur à chaque interaction. L’agent ajuste son comportement en fonction de l’état émotionnel détecté.

Résolution de dissonance

Lorsque une nouvelle instruction contredit une mémoire forte, l’agent le détecte, le verbalise et pose des questions avant de réécrire.

Garde métacognitive

Avant d’éditer le code, le gardien injecte des erreurs connues et des règles de blocage. Taux d’erreur répétée cible : <15%. 93,3% de rejet adversarial.

Score de confiance adaptatif

Indice d’alignement qui ajuste le rigor interne de l’agent. Score élevé = mode fluide. Score bas = plus de vérifications et de précautions.

Fusion discriminative de mémoires

Des mémoires similaires se fusionnent en préservant ce qui diffère. Cela évite les doublons et réduit le bruit cognitif sans perdre de nuances.

Décroissance adaptative d’Ebbinghaus

Les souvenirs non utilisés se dégradent selon la courbe de l’oubli humain. Le rappel les renforce. Seul ce qui est pertinent survit.

Plugin de rechargement à chaud

Ajoutez ou supprimez des capacités à l’exécution sans redémarrer le serveur MCP. Architecture extensible par conception.

Indexation temporelle

Les mémoires sont indexées avec des marques temporelles pour permettre des recherches par plage temporelle. Récupérez ce qui s’est passé au cours d’une semaine précise ou au cours des N derniers jours.

Poids appris

Les poids des signaux apprennent du feedback réel via la régression Ridge. Mode ombre, momentum, auto-rollback.

Marqueurs somatiques

Mémoire de douleur par fichier et zone. Le gardien avertit dans les fichiers HAUT RISQUE et CRITIQUE. Récupération validée.

Personnalité de 6 signaux

Vibe, corrections, brièveté, sujet, erreurs d’outils, git diff. Contournement d’urgence. Décroissance de sévérité.

Auto-migration

Migration automatique des bases de données cognitives vers le nouveau schéma de 768 dimensions. Sans perte de données ni intervention manuelle.

SQLite sûr pour les threads

Écritures sérialisées, testées sous stress à 100%. Sans corruptions sous charge concurrente.

Multiplateforme (Linux + Windows)

Installation identique sur macOS, Linux et Windows. Le même serveur MCP, la même base de données cognitive, sans adaptations manuelles.

Système immunitaire (disjoncteurs + chien de garde)

Les disjoncteurs interrompent les opérations échouées avant qu’elles ne se propagent. Le watchdog redémarre les processus en panne. L’agent se rétablit seul sans intervention humaine.

Moteur de réflexion

Avant d’agir, l’agent vérifie les erreurs précédentes, les schémas réels et les règles de blocage. Ensuite, il enregistre le changement et crée des suivis de vérification. Boucle complète d’auto-vérification.

Évolution hebdomadaire automatique

Chaque semaine, le système analyse ses propres schémas d’erreur, propose des améliorations à ses règles et les applique si elles sont approuvées. L’agent améliore son comportement entre les sessions sans intervention manuelle.

Orchestration complète (5 accroches)

5 hooks du cycle de session : SessionStart, PreToolCall, PostToolCall, Stop, SubagentStop. Chaque hook déclenche automatiquement la mémoire, le heartbeat, le guard et le briefing quotidien.

Installation

Un commandement. 60 secondes. Votre agent a de la mémoire.

$ npx nexo-brain init

Nécessite Python 3.10+ et Claude Code. L’installateur configure tout automatiquement : serveur MCP, bases de données, processus de maintenance cognitive.

Code ouvert pour tous

NEXO Brain est open source sous licence AGPL-3.0. Nous le mettons à la disposition de tout développeur, équipe ou entreprise qui souhaite donner une mémoire réelle à ses agents IA.

Assistant WAzion

Informations commerciales et support technique

Bonjour ! Je suis l’assistant de WAzion. Je peux vous aider avec des informations sur les tarifs et les plans, des questions techniques, la configuration, ou toute autre question concernant notre produit. Comment puis-je vous aider ?
Développé avec WAzion AI