NEXO Brain
Memoria cognitiva para agentes IA. Código abierto. Gratuito. Creado por el equipo WAzion.
AGPL-3.0 License • npm • Web oficial • GitHub
Por qué lo creamos
Construir WAzion como una sola persona significaba trabajar con agentes IA todos los días. Pero cada vez que cerrabas una sesión, el agente lo olvidaba todo. Las mismas correcciones, los mismos errores, empezar de cero cada mañana.
Necesitábamos un agente que recordara. Que aprendiera de sus errores. Que detectara cuando estaba a punto de repetir algo que ya había fallado antes. Que mantuviera continuidad entre sesiones como si fuera la misma persona.
Así nació NEXO Brain: un sistema de memoria cognitiva modelado según como funciona la memoria humana.
Cómo funciona
NEXO Brain implementa el modelo de memoria Atkinson-Shiffrin de la psicología cognitiva, el mismo modelo que explica cómo funciona la memoria humana:
Registro Sensorial
Captura todo lo que ocurre en la sesión. Descarta el ruido en 30 segundos. Solo lo relevante pasa al siguiente nivel.
Memoria a Corto Plazo
Mantiene el contexto activo de trabajo. Con rehearsal (uso repetido), las memorias se refuerzan. Sin uso, se degradan naturalmente siguiendo la curva de Ebbinghaus.
Memoria a Largo Plazo
Vectores semánticos buscables por significado. Las memorias similares se fusionan de forma discriminativa: conservan lo que difiere, unen lo que se solapa. Permanente.
Qué incluye
Más de 100 herramientas MCP
Sesiones, memoria, aprendizaje, credenciales, guard, preferencias, entidades, diario episódico y más. Todo expuesto como herramientas MCP, extensible vía plugins.
Búsqueda semántica RAG
Vectores con fastembed (768 dimensiones). Búsqueda híbrida semántica + BM25, reranking por cross-encoder y multi-query. Resultados relevantes en milisegundos.
Trust Score
Índice de alineación 0-100 que refleja la calidad del trabajo del agente. Las correcciones lo bajan, los aciertos lo suben. Controla el rigor interno.
Guard metacognitivo
Antes de editar código, el guard inyecta errores conocidos, schemas reales y reglas de bloqueo. Evita repetir errores del pasado.
Disonancia cognitiva
Detecta cuando una nueva instrucción contradice una memoria fuerte. En vez de sobreescribir en silencio, pregunta.
100% local
Todo en SQLite local. Los vectores se computan en tu máquina con ONNX Runtime. Nada sale de tu ordenador. Cero dependencias cloud.
Knowledge Graph
Grafo bi-temporal de entidades y relaciones. Consultas temporales, recorrido BFS, deduplicación inteligente con event-sourcing, y visualización interactiva D3.js.
Web Dashboard
Interfaz visual con 6 páginas: Overview, Grafo, Memoria, Somático, Adaptativo y Sesiones. FastAPI + D3.js en localhost:6174. Ve el cerebro de tu agente en tiempo real.
Multiplataforma
Soporte completo para Linux y Windows. El instalador detecta la plataforma y configura el gestor de procesos adecuado. Mantenimiento oportunista cuando hay recursos disponibles.
Context Continuity
Auto-compactación inteligente del contexto de sesión. Cuando el contexto esta al limite, NEXO Brain consolida automáticamente el historial activo en un resumen semántico sin perder el hilo de trabajo.
Benchmarks reales
Medido sobre el sistema cognitivo real de NEXO. Sin dataset sintético, sin laboratorio — producción real.
Búsqueda híbrida
Combina búsqueda vectorial semántica con BM25 (frecuencia de términos). Encuentra memorias tanto por significado como por palabras clave exactas.
Cross-encoder reranking
Después de recuperar candidatos, un segundo modelo los reordena por relevancia real con la consulta. Los resultados correctos suben, el ruido baja.
Multi-query expansion
Una sola pregunta genera múltiples variaciones de búsqueda automáticamente. Captura memorias relevantes aunque estén formuladas de forma diferente.
Chunking inteligente
Los recuerdos largos se dividen en fragmentos con solapamiento. Cada fragmento es recuperable de forma independiente sin perder contexto.
Session summaries
Resúmenes automáticos de sesiones anteriores indexados como memorias. El agente recupera el hilo de conversaciones pasadas sin releer todos los logs.
768 dimensiones
Embeddings de 768 dimensiones (era 384). Mayor capacidad semántica, mejor discriminación entre conceptos parecidos, sin aumentar dependencias externas.
Memoria episódica
Diario de sesión, change log, decision log y recall semántico. El agente sabe qué hizo, por qué, y con qué resultado.
Síntesis diaria y semanal
Resumen automático de patrones, errores recurrentes y puntos de mejora. El agente aprende entre sesiones, no solo dentro de ellas.
Detección de sentimiento
Análisis automático del tono del usuario en cada interaccion. El agente ajusta su comportamiento según el estado emocional detectado.
Resolución de disonancia
Cuando una instrucción nueva contradice una memoria fuerte, el agente lo detecta, lo verbaliza y pregunta antes de sobrescribir.
Guard metacognitivo
Antes de editar código, el guard inyecta errores conocidos y reglas de bloqueo. Tasa de error repetido objetivo: <15%. 93.3% rechazo adversarial.
Trust Score adaptativo
Índice de alineación que ajusta el rigor interno del agente. Score alto = modo fluido. Score bajo = más verificaciones y precaución.
Fusión discriminativa de memorias
Memorias similares se fusionan preservando lo que difiere. Evita duplicados y reduce ruido cognitivo sin perder matices.
Decay adaptativo Ebbinghaus
Las memorias no usadas se degradan siguiendo la curva del olvido humana. El rehearsal las refuerza. Solo sobrevive lo relevante.
Plugin hot-reload
Añade o elimina capacidades en tiempo de ejecución sin reiniciar el servidor MCP. Arquitectura extensible por diseño.
Indexación temporal
Las memorias se indexan con marcas de tiempo para permitir búsquedas por rango temporal. Recupera lo que ocurrió en una semana concreta o en los últimos N días.
Learned Weights
Los pesos de las señales aprenden del feedback real vía regresión Ridge. Modo sombra, momentum, auto-rollback.
Somatic Markers
Memoria de dolor por archivo y area. El guard advierte en archivos HIGH RISK y CRITICAL. Recuperacion validada.
Personalidad de 6 señales
Vibe, correcciones, brevedad, tema, errores de herramientas, git diff. Bypass de emergencia. Decay de severidad.
Auto-migración
Migración automática de bases de datos cognitivas anteriores al nuevo esquema de 768 dimensiones. Sin pérdida de datos ni intervención manual.
SQLite thread-safe
Escrituras serializadas, stress-tested al 100%. Sin corrupciones bajo carga concurrente.
Cross-platform (Linux + Windows)
Instalación idéntica en macOS, Linux y Windows. El mismo MCP server, la misma base de datos cognitiva, sin adaptaciones manuales.
Sistema inmune (circuit breakers + watchdog)
Circuit breakers cortan operaciones fallidas antes de que cascadeen. Watchdog reinicia procesos caídos. El agente se recupera solo sin intervención humana.
Motor de reflexión
Antes de actuar, el agente verifica errores previos, esquemas reales y reglas de bloqueo. Después registra el cambio y crea followups de verificación. Bucle completo de autoverificación.
Evolución semanal automática
Cada semana el sistema analiza sus propios patrones de error, propone mejoras a sus reglas y las aplica si son aprobadas. El agente mejora su comportamiento entre sesiones sin intervención manual.
Orquestación completa (5 hooks)
5 hooks del ciclo de sesión: SessionStart, PreToolCall, PostToolCall, Stop, SubagentStop. Cada hook dispara memoria, heartbeat, guard y briefing diario de forma automática.
Instalación
Un comando. 60 segundos. Tu agente tiene memoria.
Requiere Python 3.10+ y Claude Code. El instalador configura todo automáticamente: servidor MCP, bases de datos, procesos de mantenimiento cognitivo.
Código abierto para todos
NEXO Brain es open source bajo licencia AGPL-3.0. Lo ponemos a disposición de cualquier desarrollador, equipo o empresa que quiera dar memoria real a sus agentes IA.