NEXO Brain
Kognitive Gedächtnis für KI-Agenten. Open Source. Kostenlos. Erstellt vom WAzion-Team.
AGPL-3.0 License • npm • Offizielle Webseite • GitHub
Warum wir es geschaffen haben
WAzion als eine einzige Person zu bauen bedeutete, jeden Tag mit KI-Agenten zu arbeiten. Aber jedes Mal, wenn du eine Sitzung beendetest, vergaß der Agent alles. Die gleichen Korrekturen, die gleichen Fehler, jeden Morgen von vorne anfangen.
Wir benötigten einen Agenten, der sich erinnerte. Der aus seinen Fehlern lernte. Der erkannte, wann er kurz davor war, etwas zu wiederholen, das zuvor schon gescheitert war. Der Kontinuität zwischen den Sitzungen aufrechterhielt, als wäre er dieselbe Person.
So entstand NEXO Brain: ein kognitives Gedächtnissystem, das nach dem Vorbild der menschlichen Gedächtnisfunktion gestaltet ist.
Wie es funktioniert
NEXO Brain implementiert das Atkinson-Shiffrin-Gedächtnismodell der kognitiven Psychologie, dasselbe Modell, das erklärt, wie das menschliche Gedächtnis funktioniert:
Sensorische Registrierung
Erfasse alles, was in der Sitzung passiert. Blende das Rauschen in 30 Sekunden aus. Nur das Relevante kommt auf die nächste Ebene.
Kurzzeitgedächtnis
Hält den aktiven Arbeitskontext aufrecht. Mit Wiederholung (wiederholte Nutzung) werden die Erinnerungen gestärkt. Ohne Nutzung degradieren sie natürlich gemäß der Ebbinghaus-Kurve.
Langzeitgedächtnis
Suchbare semantische Vektoren nach Bedeutung. Ähnliche Erinnerungen fusionieren diskriminativ: Sie bewahren, was sich unterscheidet, und vereinen, was sich überschneidet. Permanent.
Was ist enthalten
Mehr als 100 MCP-Tools
Sitzungen, Speicher, Lernen, Anmeldeinformationen, Schutz, Präferenzen, Entitäten, episodisches Tagebuch und mehr. Alles dargestellt als MCP-Tools, erweiterbar über Plugins.
Semantische Suche RAG
Vektoren mit Fastembed (768 Dimensionen). Hybride semantische Suche + BM25, Nachbearbeitung durch Cross-Encoder und Multi-Query. Relevante Ergebnisse in Millisekunden.
Vertrauenspunktzahl
Ausrichtungsindex 0-100, der die Qualität der Arbeit des Agenten widerspiegelt. Korrekturen senken ihn, Erfolge erhöhen ihn. Kontrolliert die interne Strenge.
Metakognitiver Wächter
Bevor der Code bearbeitet wird, injiziert der Guard bekannte Fehler, reale Schemata und Sperrregeln. Er vermeidet es, Fehler aus der Vergangenheit zu wiederholen.
Kognitive Dissonanz
Erkenne, wenn eine neue Anweisung einen starken Speicher widerspricht. Anstatt stillschweigend zu überschreiben, frage.
100% lokal
Alles in SQLite lokal. Die Vektoren werden auf deinem Rechner mit ONNX Runtime berechnet. Nichts verlässt deinen Computer. Null Cloud-Abhängigkeiten.
Wissensgraph
Bitemporales Graph von Entitäten und Beziehungen. Temporale Abfragen, BFS-Durchlauf, intelligente Deduplication mit Event-Sourcing und interaktive Visualisierung mit D3.js.
Web-Dashboard
Visuelle Schnittstelle mit 6 Seiten: Übersicht, Graph, Speicher, Somatisch, Adaptiv und Sitzungen. FastAPI + D3.js auf localhost:6174. Sieh das Gehirn deines Agenten in Echtzeit.
Multiplattform
Vollständige Unterstützung für Linux und Windows. Der Installer erkennt die Plattform und konfiguriert den entsprechenden Prozessmanager. Opportunistische Wartung, wenn Ressourcen verfügbar sind.
Kontextkontinuität
Intelligente Selbstkompaktierung des Sitzungs-Kontexts. Wenn der Kontext am Limit ist, konsolidiert NEXO Brain automatisch die aktive Historie in einer semantischen Zusammenfassung, ohne den Arbeitsfaden zu verlieren.
Echte Benchmarks
Gemessen am realen kognitiven System von NEXO. Ohne synthetisches Dataset, ohne Labor — reale Produktion.
Hybride Suche
Kombiniert semantische Vektorsuche mit BM25 (Terminhäufigkeit). Findet Erinnerungen sowohl nach Bedeutung als auch nach genauen Schlüsselwörtern.
Cross-Encoder-Reranking
Nachdem Kandidaten gesammelt wurden, ordnet ein zweites Modell sie nach tatsächlicher Relevanz zur Anfrage neu. Die korrekten Ergebnisse steigen, das Rauschen sinkt.
Mehrfachabfrageerweiterung
Eine einzige Frage erzeugt automatisch mehrere Suchvariationen. Sie erfasst relevante Erinnerungen, auch wenn sie unterschiedlich formuliert sind.
Intelligentes Chunking
Lange Erinnerungen werden in überlappende Fragmente unterteilt. Jedes Fragment ist unabhängig abrufbar, ohne den Kontext zu verlieren.
Sitzungszusammenfassungen
Automatische Zusammenfassungen früherer Sitzungen, die als Erinnerungen indiziert sind. Der Agent stellt den Faden früherer Gespräche wieder her, ohne alle Protokolle erneut zu lesen.
768 Dimensionen
768-dimensionalen Embeddings (früher 384). Höhere semantische Kapazität, bessere Unterscheidung zwischen ähnlichen Konzepten, ohne externe Abhängigkeiten zu erhöhen.
Episodisches Gedächtnis
Sitzungsprotokoll, Änderungsprotokoll, Entscheidungsprotokoll und semantisches Recall. Der Agent weiß, was er getan hat, warum und mit welchem Ergebnis.
Tägliche und wöchentliche Zusammenfassung
Automatische Zusammenfassung von Mustern, wiederkehrenden Fehlern und Verbesserungspunkten. Der Agent lernt zwischen den Sitzungen, nicht nur innerhalb davon.
Sentimentanalyse
Automatische Analyse des Tons des Benutzers bei jeder Interaktion. Der Agent passt sein Verhalten entsprechend dem erkannten emotionalen Zustand an.
Auflösung von Dissonanz
Wenn eine neue Anweisung einen starken Speicher widerspricht, erkennt der Agent dies, verbalisiert es und fragt, bevor er überschreibt.
Metakognitiver Wächter
Bevor der Code bearbeitet wird, injiziert der Guard bekannte Fehler und Sperrregeln. Zielrate für wiederholte Fehler: <15%. 93,3% adversarische Ablehnung.
Adaptiver Vertrauensscore
Ausrichtungsindex, der die interne Strenge des Agenten anpasst. Hohe Punktzahl = flüssiger Modus. Niedrige Punktzahl = mehr Überprüfungen und Vorsicht.
Diskriminative Fusion von Erinnerungen
Ähnliche Erinnerungen verschmelzen und bewahren, was sich unterscheidet. Sie vermeiden Duplikate und reduzieren kognitives Rauschen, ohne Nuancen zu verlieren.
Adaptiver Zerfall Ebbinghaus
Die ungenutzten Erinnerungen verfallen gemäß der menschlichen Vergessenskurve. Das Wiederholen stärkt sie. Nur das Relevante überlebt.
Plugin für Hot-Reload
Fügen Sie zur Laufzeit Funktionen hinzu oder entfernen Sie sie, ohne den MCP-Server neu zu starten. Von Grund auf erweiterbare Architektur.
Zeitliche Indizierung
Die Erinnerungen werden mit Zeitstempeln indiziert, um zeitbasierte Suchen zu ermöglichen. Rufen Sie ab, was in einer bestimmten Woche oder in den letzten N Tagen passiert ist.
Gelerntes Gewicht
Die Gewichte der Signale lernen aus dem realen Feedback über Ridge-Regression. Schattenmodus, Momentum, automatisches Rollback.
Somatische Marker
Schmerzgedächtnis nach Archiv und Bereich. Der Wächter warnt in den Archiven HOHE RISIKEN und KRITISCH. Validierte Wiederherstellung.
Persönlichkeit von 6 Zeichen
Vibe, Korrekturen, Kürze, Thema, Fehler von Werkzeugen, git diff. Notfall-Bypass. Schweregradverfall.
Auto-Migration
Automatische Migration von früheren kognitiven Datenbanken zum neuen Schema mit 768 Dimensionen. Ohne Datenverlust und ohne manuelle Eingriffe.
SQLite threadsicher
Serialisierte Schriften, zu 100 % auf Stress getestet. Keine Korruption unter gleichzeitiger Last.
Plattformübergreifend (Linux + Windows)
Identische Installation auf macOS, Linux und Windows. Der gleiche MCP-Server, die gleiche kognitive Datenbank, ohne manuelle Anpassungen.
Immunsystem (Sicherheitsvorrichtungen + Aufpasser)
Leistungsschalter unterbrechen fehlgeschlagene Operationen, bevor sie kaskadieren. Der Watchdog startet abgestürzte Prozesse neu. Der Agent erholt sich selbstständig ohne menschliches Eingreifen.
Reflexionsmotor
Bevor der Agent handelt, überprüft er vorherige Fehler, reale Schemen und Sperrregeln. Danach registriert er die Änderung und erstellt Überprüfungs-Follow-ups. Vollständige Schleife der Selbstüberprüfung.
Automatische wöchentliche Entwicklung
Jede Woche analysiert das System seine eigenen Fehlerpatterns, schlägt Verbesserungen seiner Regeln vor und wendet sie an, wenn sie genehmigt werden. Der Agent verbessert sein Verhalten zwischen den Sitzungen ohne manuelle Intervention.
Vollständige Orchestrierung (5 Hooks)
5 Hooks des Sitzzyklus: SessionStart, PreToolCall, PostToolCall, Stop, SubagentStop. Jeder Hook löst automatisch Speicher, Herzschlag, Wächter und tägliches Briefing aus.
Installation
Ein Befehl. 60 Sekunden. Ihr Agent hat Gedächtnis.
Erfordert Python 3.10+ und Claude Code. Der Installer konfiguriert alles automatisch: MCP-Server, Datenbanken, kognitive Wartungsprozesse.
Open Source für alle
NEXO Brain ist Open Source unter der Lizenz AGPL-3.0. Wir stellen es jedem Entwickler, Team oder Unternehmen zur Verfügung, das seinen KI-Agenten echtes Gedächtnis verleihen möchte.