Actualizado en mayo de 2026
Zep es un backend de memoria de largo plazo para agentes de IA. Su diferenciador principal es el grafo de conocimiento temporal: a medida que entran las conversaciones, Zep extrae automáticamente entidades (personas, proyectos, productos, conceptos), sigue sus atributos a lo largo del tiempo y deja al agente consultar «qué sabíamos sobre X en la fecha Y» o «qué cambió sobre X entre entonces y ahora». El motor de grafo Graphiti lo impulsa; el SDK y el producto cloud gestionado lo envuelven.
Zep está posicionado para equipos de ingeniería construyendo agentes de IA a escala — típicamente productos SaaS B2B donde la IA gestiona interacciones complejas multi-turno y el equipo valora el razonamiento tipado de grafos sobre la recuperación plana por vectores. Los precios son mayoritariamente enterprise / a medida; existe una edición comunitaria open source para self-hosting.
Alma es un producto completo de memoria persistente. Los usuarios finales se registran en alma.olivares.ai, chatean con Anthropic Claude (Haiku, Sonnet, Opus 4.7 con 1M tokens de contexto) y la capa de memoria captura hechos, preferencias y decisiones automáticamente. El Soul Engine gestiona la identidad de la IA. Los estudios de Image, Video, Music y Code están incluidos en Pro y Max. Los desarrolladores también pueden usar el MCP server, el SDK de JavaScript y la REST API en el plan Max.
La memoria está estructurada en tres capas (memorias, episodios, procedimientos) con puntuación de cinco factores. Los planes de pago empiezan en $14/mes (Starter) con acceso completo al Soul Engine.
El grafo de conocimiento temporal de Zep es su feature más fuerte. Las entidades son ciudadanos de primera clase; puedes preguntar «¿qué es el proyecto X?», «¿quién trabaja en el proyecto X?», «¿cuándo cambió el deadline?» y Zep atraviesa el grafo para responder. Esto es genuinamente potente cuando la IA necesita razonar sobre relaciones entre muchas entidades y cómo evolucionan con el tiempo — típico de IA de soporte al cliente, agentes de investigación y automatización de workflow B2B.
El modelo de 3 capas de Alma tiene opinión sobre la forma: memorias (hechos y preferencias), episodios (resúmenes de conversación) y procedimientos (workflows aprendidos). La extracción de entidades corre de forma heurística en cada creación de memoria (sin coste LLM extra en lectura) y alimenta un grafo de conocimiento interno, pero el modelo expuesto al usuario son las tres capas, no el propio grafo. La recuperación es híbrida (semántica + keyword) con puntuación de cinco factores. El trade-off: menos razonamiento explícito de grafo, pero un modelo mental mucho más simple y un prompt ensamblado funcional en menos de 100 ms sin un lenguaje de query de grafo que aprender.
Zep es infraestructura: un equipo de ingeniería lo integra en su producto de IA. La mayoría de usuarios nunca ven el nombre de Zep; ven tu producto, que resulta que los recuerda. Alma es un producto: los usuarios finales se registran directamente, la marca Alma es la experiencia y los desarrolladores son un público adicional servido por el SDK y el MCP server.
Si tu equipo está construyendo un agente de IA con razonamiento multi-entidad sofisticado en su núcleo, Zep está diseñado exactamente para eso. Si tú (o tu equipo) queréis usar IA con memoria entre las herramientas con las que ya trabajáis — Cursor, Claude Desktop, VSCode — Alma lo cubre sin escribir código de integración.
| Característica | Zep | Alma |
|---|---|---|
| Usuario objetivo | Desarrolladores / equipos de ingeniería construyendo agentes de IA | Usuarios finales + desarrolladores |
| Modelo de memoria | Grafo de conocimiento temporal con extracción de entidades (Graphiti) | 3 capas (memorias + episodios + procedimientos) con grafo de entidades interno |
| Web app / chat | No — solo API y dashboard de admin | Sí — chat completo con streaming, tools, adjuntos de fichero |
| Identidad de IA | No incluida — tráela tú | Soul Engine (13 bloques versionados de identidad) |
| Consciencia temporal | Primera clase — sigue cambios de entidad a lo largo del tiempo | Episodios + timestamps de memoria + decaimiento por importancia (sin lenguaje de query de grafo) |
| Ensamblado de contexto | Tráelo tú — las queries de grafo devuelven datos, tú construyes el prompt | Incluido — system prompt ensamblado <100 ms, puntuación de 5 factores |
| Integraciones | SDK, REST API, adaptadores de framework | MCP (Claude Desktop / Cursor / Windsurf), VSCode, SDK JS, REST API |
| Herramientas creativas | Ninguna | Estudios Image / Video / Music / Code en Pro y Max |
| BYOK | N/A | Sí en Max — Anthropic, Replicate, Leonardo, ElevenLabs |
| Complejidad de setup | Alta — conceptos de DB de grafo, trabajo de integración | Regístrate y chatea — cero infraestructura para usuarios |
| Precio | Edición comunitaria open source · cloud / enterprise (a medida) | Starter $14/mes · Pro $29/mes · Max $99/mes |
La edición comunitaria open source de Zep corre gratis si self-hosteas la base de datos de grafo y escribes el código de integración. Los tiers cloud hospedado y enterprise se cotizan bajo demanda y van dirigidos a equipos lanzando agentes de IA a escala. Los precios de Alma son directos y orientados a usuario final: Starter $14/mes (memorias ilimitadas, Haiku + Sonnet), Pro $29/mes (añade Opus 4.7 con 1M tokens de contexto, environments ilimitados y estudios creativos), Max $99/mes (añade API, MCP server, extensión de VSCode, SDK y BYOK). La facturación anual es «paga 10 meses, recibe 12» en cada plan de pago.
Memoria de usuario final entre herramientas. Un usuario quiere IA con memoria entre Claude Desktop, Cursor, VSCode y la web. Zep no tiene producto de usuario final — es infraestructura para embebber en el producto de otro. Alma es el propio producto de usuario final: regístrate, conecta el MCP server y cada cliente soportado tiene memoria en cinco minutos.
Agente B2B de soporte al cliente con razonamiento temporal. Un equipo de ingeniería está construyendo un agente de IA que gestiona tickets de soporte y necesita razonar sobre «¿qué sabíamos sobre la cuenta X en la fecha Y?» o «¿cuándo cambiaron los términos del contrato?». El grafo de conocimiento temporal (Graphiti) de Zep está hecho para esto — las entidades son ciudadanos de primera clase, los atributos se siguen a lo largo del tiempo, las queries de grafo responden a las preguntas temporales de forma natural. El modelo tipado de 3 capas de Alma puede responder «¿qué sabemos sobre X?» vía búsqueda, pero no expone queries explícitas de grafo temporal — esa es la fortaleza diferenciada de Zep.
Desarrollador en solitario que quiere memoria en su proyecto paralelo de IA. Un desarrollador está construyendo una pequeña herramienta de IA y quiere memoria persistente sin levantar una base de datos de grafo, correr migraciones y escribir código de query de grafo. El SDK de Alma en Max ($99/mes) proporciona una capa cognitiva completa (memoria + Soul + ensamblado de contexto) con una API HTTP. La edición comunitaria self-hosted de Zep también es gratis para este caso pero espera inversión de ingeniería antes de que se entregue la primera feature.
Elige Zep si eres un equipo de ingeniería construyendo un producto de agente de IA donde el razonamiento temporal de entidades es central en la experiencia — una IA de soporte al cliente siguiendo cuentas, un agente de investigación siguiendo hipótesis durante semanas, una automatización de workflow empresarial que necesita saber exactamente cuándo cambió un hecho y por qué. El modelo de grafo compensa cuando «muéstrame el estado de la entidad X en la fecha Y» es una query real que necesitas responder. Escribirás código de integración y probablemente una UI envolvente; ese es el trato.
Elige Alma si quieres usar memoria de IA en lugar de construir infraestructura. Regístrate, empieza a chatear y la memoria funciona. Si además trabajas en Cursor / Claude Desktop / VSCode / Windsurf, instala el MCP server (gratis) y la misma memoria te sigue. Elige Alma si quieres una identidad de IA estructurada (Soul Engine), estudios creativos incluidos o una suscripción asequible para un único usuario. Los desarrolladores que quieran embebber Alma en sus propias apps obtienen el SDK, el MCP server y la REST API en el plan Max ($99/mes) — una capa cognitiva completa en lugar de solo un backend de memoria.
¿Alma tiene consciencia temporal? Sí, pero con un modelo distinto. Las memorias llevan timestamps de creación y último acceso; los episodios son resúmenes de conversación ordenados temporalmente; el decaimiento por importancia (la puntuación de 5 factores incluye recencia 10%) deja que las memorias antiguas se desvanezcan de forma natural. No hay lenguaje de query de grafo para «estado en el momento T» — esa es la feature diferenciada de Zep, no de Alma.
¿Alma tiene un grafo de conocimiento de entidades? Sí, internamente. La extracción de entidades corre de forma heurística en cada creación de memoria (sin coste LLM extra en lectura) y alimenta el grafo usado en el momento de recuperación. No es consultable como grafo por el usuario hoy; el modelo expuesto al usuario sigue siendo «memorias / episodios / procedimientos».
¿Puede Alma sustituir a Zep en mi producto de agente de IA? A veces. Si tu agente es orientado a usuario final y las necesidades de memoria son «recordar preferencias, decisiones y contexto entre sesiones», el SDK + REST API de Alma en Max te dan lo que necesitas sin construir una envoltura. Si necesitas queries explícitas de grafo temporal, Zep es la herramienta correcta.
¿Es Alma open source? No. Alma es un SaaS hospedado. Zep ofrece una edición comunitaria open source que puedes self-hostear.
Zep está hecho para equipos de ingeniería lanzando agentes de IA que necesitan razonamiento explícito de grafo temporal. Alma es la herramienta correcta cuando quieres un producto de memoria completo (chat, Soul Engine, MCP, estudios creativos) sin trabajo de infraestructura, o cuando necesitas una capa cognitiva para tu propia app sin escribir el modelo tipado de memoria y el Soul Engine tú mismo. El plan Starter ($14/mes) te muestra el producto de principio a fin en cinco minutos.
Ver planes · Ver planes · Documentos para desarrolladores y SDK