NEXO Brain

NEXO Brain

Memoria cognitiva para agentes IA. Código abierto. Gratuito. Creado por el equipo WAzion.

AGPL-3.0 License • npm • Web oficialGitHub

npm version GitHub stars npm downloads

Por qué lo creamos

Construir WAzion como una sola persona significaba trabajar con agentes IA todos los días. Pero cada vez que cerrabas una sesión, el agente lo olvidaba todo. Las mismas correcciones, los mismos errores, empezar de cero cada mañana.

Necesitábamos un agente que recordara. Que aprendiera de sus errores. Que detectara cuando estaba a punto de repetir algo que ya había fallado antes. Que mantuviera continuidad entre sesiones como si fuera la misma persona.

Así nació NEXO Brain: un sistema de memoria cognitiva modelado según como funciona la memoria humana.

Cómo funciona

NEXO Brain implementa el modelo de memoria Atkinson-Shiffrin de la psicología cognitiva, el mismo modelo que explica cómo funciona la memoria humana:

Registro Sensorial

Captura todo lo que ocurre en la sesión. Descarta el ruido en 30 segundos. Solo lo relevante pasa al siguiente nivel.

Memoria a Corto Plazo

Mantiene el contexto activo de trabajo. Con rehearsal (uso repetido), las memorias se refuerzan. Sin uso, se degradan naturalmente siguiendo la curva de Ebbinghaus.

Memoria a Largo Plazo

Vectores semánticos buscables por significado. Las memorias similares se fusionan de forma discriminativa: conservan lo que difiere, unen lo que se solapa. Permanente.

Qué incluye

Más de 100 herramientas MCP

Sesiones, memoria, aprendizaje, credenciales, guard, preferencias, entidades, diario episódico y más. Todo expuesto como herramientas MCP, extensible vía plugins.

Búsqueda semántica RAG

Vectores con fastembed (768 dimensiones). Búsqueda híbrida semántica + BM25, reranking por cross-encoder y multi-query. Resultados relevantes en milisegundos.

Trust Score

Índice de alineación 0-100 que refleja la calidad del trabajo del agente. Las correcciones lo bajan, los aciertos lo suben. Controla el rigor interno.

Guard metacognitivo

Antes de editar código, el guard inyecta errores conocidos, schemas reales y reglas de bloqueo. Evita repetir errores del pasado.

Disonancia cognitiva

Detecta cuando una nueva instrucción contradice una memoria fuerte. En vez de sobreescribir en silencio, pregunta.

100% local

Todo en SQLite local. Los vectores se computan en tu máquina con ONNX Runtime. Nada sale de tu ordenador. Cero dependencias cloud.

Knowledge Graph

Grafo bi-temporal de entidades y relaciones. Consultas temporales, recorrido BFS, deduplicación inteligente con event-sourcing, y visualización interactiva D3.js.

Web Dashboard

Interfaz visual con 6 páginas: Overview, Grafo, Memoria, Somático, Adaptativo y Sesiones. FastAPI + D3.js en localhost:6174. Ve el cerebro de tu agente en tiempo real.

Multiplataforma

Soporte completo para Linux y Windows. El instalador detecta la plataforma y configura el gestor de procesos adecuado. Mantenimiento oportunista cuando hay recursos disponibles.

Context Continuity

Auto-compactación inteligente del contexto de sesión. Cuando el contexto esta al limite, NEXO Brain consolida automáticamente el historial activo en un resumen semántico sin perder el hilo de trabajo.

Benchmarks reales

Medido sobre el sistema cognitivo real de NEXO. Sin dataset sintético, sin laboratorio — producción real.

0.588
F1 Score RAG
Precisión de recuperación de memorias relevantes
+55%
vs GPT-4
Mejora en relevancia de recuperación semántica
93.3%
Rechazo adversarial
Instrucciones maliciosas bloqueadas por el guard

Búsqueda híbrida

Combina búsqueda vectorial semántica con BM25 (frecuencia de términos). Encuentra memorias tanto por significado como por palabras clave exactas.

Cross-encoder reranking

Después de recuperar candidatos, un segundo modelo los reordena por relevancia real con la consulta. Los resultados correctos suben, el ruido baja.

Multi-query expansion

Una sola pregunta genera múltiples variaciones de búsqueda automáticamente. Captura memorias relevantes aunque estén formuladas de forma diferente.

Chunking inteligente

Los recuerdos largos se dividen en fragmentos con solapamiento. Cada fragmento es recuperable de forma independiente sin perder contexto.

Session summaries

Resúmenes automáticos de sesiones anteriores indexados como memorias. El agente recupera el hilo de conversaciones pasadas sin releer todos los logs.

768 dimensiones

Embeddings de 768 dimensiones (era 384). Mayor capacidad semántica, mejor discriminación entre conceptos parecidos, sin aumentar dependencias externas.

Memoria episódica

Diario de sesión, change log, decision log y recall semántico. El agente sabe qué hizo, por qué, y con qué resultado.

Síntesis diaria y semanal

Resumen automático de patrones, errores recurrentes y puntos de mejora. El agente aprende entre sesiones, no solo dentro de ellas.

Detección de sentimiento

Análisis automático del tono del usuario en cada interaccion. El agente ajusta su comportamiento según el estado emocional detectado.

Resolución de disonancia

Cuando una instrucción nueva contradice una memoria fuerte, el agente lo detecta, lo verbaliza y pregunta antes de sobrescribir.

Guard metacognitivo

Antes de editar código, el guard inyecta errores conocidos y reglas de bloqueo. Tasa de error repetido objetivo: <15%. 93.3% rechazo adversarial.

Trust Score adaptativo

Índice de alineación que ajusta el rigor interno del agente. Score alto = modo fluido. Score bajo = más verificaciones y precaución.

Fusión discriminativa de memorias

Memorias similares se fusionan preservando lo que difiere. Evita duplicados y reduce ruido cognitivo sin perder matices.

Decay adaptativo Ebbinghaus

Las memorias no usadas se degradan siguiendo la curva del olvido humana. El rehearsal las refuerza. Solo sobrevive lo relevante.

Plugin hot-reload

Añade o elimina capacidades en tiempo de ejecución sin reiniciar el servidor MCP. Arquitectura extensible por diseño.

Indexación temporal

Las memorias se indexan con marcas de tiempo para permitir búsquedas por rango temporal. Recupera lo que ocurrió en una semana concreta o en los últimos N días.

Learned Weights

Los pesos de las señales aprenden del feedback real vía regresión Ridge. Modo sombra, momentum, auto-rollback.

Somatic Markers

Memoria de dolor por archivo y area. El guard advierte en archivos HIGH RISK y CRITICAL. Recuperacion validada.

Personalidad de 6 señales

Vibe, correcciones, brevedad, tema, errores de herramientas, git diff. Bypass de emergencia. Decay de severidad.

Auto-migración

Migración automática de bases de datos cognitivas anteriores al nuevo esquema de 768 dimensiones. Sin pérdida de datos ni intervención manual.

SQLite thread-safe

Escrituras serializadas, stress-tested al 100%. Sin corrupciones bajo carga concurrente.

Cross-platform (Linux + Windows)

Instalación idéntica en macOS, Linux y Windows. El mismo MCP server, la misma base de datos cognitiva, sin adaptaciones manuales.

Sistema inmune (circuit breakers + watchdog)

Circuit breakers cortan operaciones fallidas antes de que cascadeen. Watchdog reinicia procesos caídos. El agente se recupera solo sin intervención humana.

Motor de reflexión

Antes de actuar, el agente verifica errores previos, esquemas reales y reglas de bloqueo. Después registra el cambio y crea followups de verificación. Bucle completo de autoverificación.

Evolución semanal automática

Cada semana el sistema analiza sus propios patrones de error, propone mejoras a sus reglas y las aplica si son aprobadas. El agente mejora su comportamiento entre sesiones sin intervención manual.

Orquestación completa (5 hooks)

5 hooks del ciclo de sesión: SessionStart, PreToolCall, PostToolCall, Stop, SubagentStop. Cada hook dispara memoria, heartbeat, guard y briefing diario de forma automática.

Instalación

Un comando. 60 segundos. Tu agente tiene memoria.

$ npx nexo-brain init

Requiere Python 3.10+ y Claude Code. El instalador configura todo automáticamente: servidor MCP, bases de datos, procesos de mantenimiento cognitivo.

Código abierto para todos

NEXO Brain es open source bajo licencia AGPL-3.0. Lo ponemos a disposición de cualquier desarrollador, equipo o empresa que quiera dar memoria real a sus agentes IA.

Asistente WAzion

Informacion comercial y soporte tecnico

Hola! Soy el asistente de WAzion. Puedo ayudarte con informacion sobre precios y planes, dudas tecnicas, configuracion, o cualquier pregunta sobre nuestro producto. Como puedo ayudarte?
Desarrollado con WAzion AI