Alma vs Zep

Q: ¿Alma tiene consciencia temporal?

Sí — las memorias llevan timestamps, los episodios son resúmenes de conversación ordenados temporalmente y el decaimiento por importancia deja que las memorias antiguas se desvanezcan de forma natural. No hay lenguaje de query de grafo para estado-en-momento-T; esa es una feature específica de Zep.

Q: ¿Alma tiene un grafo de conocimiento de entidades?

Sí, internamente. La extracción de entidades corre de forma heurística en cada creación de memoria (sin coste LLM extra en lectura) y alimenta el grafo usado en el momento de recuperación. No es consultable como grafo por el usuario hoy.

Q: ¿Puede Alma sustituir a Zep en mi producto de agente de IA?

A veces. Si tu agente es orientado a usuario final y las necesidades de memoria son recordar preferencias y decisiones entre sesiones, el SDK + REST API de Alma en Max funcionan. Si necesitas queries explícitas de grafo temporal, Zep es la herramienta correcta.

Q: ¿Es Alma open source?

No. Alma es un SaaS hospedado. Zep ofrece una edición comunitaria open source que puedes self-hostear.

Actualizado en mayo de 2026

Zep es un producto de infraestructura para desarrolladores: un grafo de conocimiento temporal que extrae automáticamente entidades de las conversaciones y sigue cómo cambian los hechos con el tiempo. Lo integras en tu propia app de IA vía API o SDK. Alma es un producto completo: web app, chat con Claude, identidad Soul Engine, MCP server, extensión de VSCode y estudios creativos — listo para usar sin escribir código de infraestructura.

¿Qué es Zep?

Zep es un backend de memoria de largo plazo para agentes de IA. Su diferenciador principal es el grafo de conocimiento temporal: a medida que entran las conversaciones, Zep extrae automáticamente entidades (personas, proyectos, productos, conceptos), sigue sus atributos a lo largo del tiempo y deja al agente consultar «qué sabíamos sobre X en la fecha Y» o «qué cambió sobre X entre entonces y ahora». El motor de grafo Graphiti lo impulsa; el SDK y el producto cloud gestionado lo envuelven.

Zep está posicionado para equipos de ingeniería construyendo agentes de IA a escala — típicamente productos SaaS B2B donde la IA gestiona interacciones complejas multi-turno y el equipo valora el razonamiento tipado de grafos sobre la recuperación plana por vectores. Los precios son mayoritariamente enterprise / a medida; existe una edición comunitaria open source para self-hosting.

¿Qué es Alma?

Alma es un producto completo de memoria persistente. Los usuarios finales se registran en alma.olivares.ai, chatean con Anthropic Claude (Haiku, Sonnet, Opus 4.7 con 1M tokens de contexto) y la capa de memoria captura hechos, preferencias y decisiones automáticamente. El Soul Engine gestiona la identidad de la IA. Los estudios de Image, Video, Music y Code están incluidos en Pro y Max. Los desarrolladores también pueden usar el MCP server, el SDK de JavaScript y la REST API en el plan Max.

La memoria está estructurada en tres capas (memorias, episodios, procedimientos) con puntuación de cinco factores. Los planes de pago empiezan en $14/mes (Starter) con acceso completo al Soul Engine.

¿En qué se diferencian respecto a la arquitectura de memoria?

El grafo de conocimiento temporal de Zep es su feature más fuerte. Las entidades son ciudadanos de primera clase; puedes preguntar «¿qué es el proyecto X?», «¿quién trabaja en el proyecto X?», «¿cuándo cambió el deadline?» y Zep atraviesa el grafo para responder. Esto es genuinamente potente cuando la IA necesita razonar sobre relaciones entre muchas entidades y cómo evolucionan con el tiempo — típico de IA de soporte al cliente, agentes de investigación y automatización de workflow B2B.

El modelo de 3 capas de Alma tiene opinión sobre la forma: memorias (hechos y preferencias), episodios (resúmenes de conversación) y procedimientos (workflows aprendidos). La extracción de entidades corre de forma heurística en cada creación de memoria (sin coste LLM extra en lectura) y alimenta un grafo de conocimiento interno, pero el modelo expuesto al usuario son las tres capas, no el propio grafo. La recuperación es híbrida (semántica + keyword) con puntuación de cinco factores. El trade-off: menos razonamiento explícito de grafo, pero un modelo mental mucho más simple y un prompt ensamblado funcional en menos de 100 ms sin un lenguaje de query de grafo que aprender.

¿En qué se diferencian respecto al usuario objetivo?

Zep es infraestructura: un equipo de ingeniería lo integra en su producto de IA. La mayoría de usuarios nunca ven el nombre de Zep; ven tu producto, que resulta que los recuerda. Alma es un producto: los usuarios finales se registran directamente, la marca Alma es la experiencia y los desarrolladores son un público adicional servido por el SDK y el MCP server.

Si tu equipo está construyendo un agente de IA con razonamiento multi-entidad sofisticado en su núcleo, Zep está diseñado exactamente para eso. Si tú (o tu equipo) queréis usar IA con memoria entre las herramientas con las que ya trabajáis — Cursor, Claude Desktop, VSCode — Alma lo cubre sin escribir código de integración.

Comparación característica a característica

Característica	Zep	Alma
Usuario objetivo	Desarrolladores / equipos de ingeniería construyendo agentes de IA	Usuarios finales + desarrolladores
Modelo de memoria	Grafo de conocimiento temporal con extracción de entidades (Graphiti)	3 capas (memorias + episodios + procedimientos) con grafo de entidades interno
Web app / chat	No — solo API y dashboard de admin	Sí — chat completo con streaming, tools, adjuntos de fichero
Identidad de IA	No incluida — tráela tú	Soul Engine (13 bloques versionados de identidad)
Consciencia temporal	Primera clase — sigue cambios de entidad a lo largo del tiempo	Episodios + timestamps de memoria + decaimiento por importancia (sin lenguaje de query de grafo)
Ensamblado de contexto	Tráelo tú — las queries de grafo devuelven datos, tú construyes el prompt	Incluido — system prompt ensamblado <100 ms, puntuación de 5 factores
Integraciones	SDK, REST API, adaptadores de framework	MCP (Claude Desktop / Cursor / Windsurf), VSCode, SDK JS, REST API
Herramientas creativas	Ninguna	Estudios Image / Video / Music / Code en Pro y Max
BYOK	N/A	Sí en Max — Anthropic, Replicate, Leonardo, ElevenLabs
Complejidad de setup	Alta — conceptos de DB de grafo, trabajo de integración	Regístrate y chatea — cero infraestructura para usuarios
Precio	Edición comunitaria open source · cloud / enterprise (a medida)	Starter $14/mes · Pro $29/mes · Max $99/mes

Comparación de precios

La edición comunitaria open source de Zep corre gratis si self-hosteas la base de datos de grafo y escribes el código de integración. Los tiers cloud hospedado y enterprise se cotizan bajo demanda y van dirigidos a equipos lanzando agentes de IA a escala. Los precios de Alma son directos y orientados a usuario final: Starter $14/mes (memorias ilimitadas, Haiku + Sonnet), Pro $29/mes (añade Opus 4.7 con 1M tokens de contexto, environments ilimitados y estudios creativos), Max $99/mes (añade API, MCP server, extensión de VSCode, SDK y BYOK). La facturación anual es «paga 10 meses, recibe 12» en cada plan de pago.

Workflows habituales en la práctica

Memoria de usuario final entre herramientas. Un usuario quiere IA con memoria entre Claude Desktop, Cursor, VSCode y la web. Zep no tiene producto de usuario final — es infraestructura para embebber en el producto de otro. Alma es el propio producto de usuario final: regístrate, conecta el MCP server y cada cliente soportado tiene memoria en cinco minutos.

Agente B2B de soporte al cliente con razonamiento temporal. Un equipo de ingeniería está construyendo un agente de IA que gestiona tickets de soporte y necesita razonar sobre «¿qué sabíamos sobre la cuenta X en la fecha Y?» o «¿cuándo cambiaron los términos del contrato?». El grafo de conocimiento temporal (Graphiti) de Zep está hecho para esto — las entidades son ciudadanos de primera clase, los atributos se siguen a lo largo del tiempo, las queries de grafo responden a las preguntas temporales de forma natural. El modelo tipado de 3 capas de Alma puede responder «¿qué sabemos sobre X?» vía búsqueda, pero no expone queries explícitas de grafo temporal — esa es la fortaleza diferenciada de Zep.

Desarrollador en solitario que quiere memoria en su proyecto paralelo de IA. Un desarrollador está construyendo una pequeña herramienta de IA y quiere memoria persistente sin levantar una base de datos de grafo, correr migraciones y escribir código de query de grafo. El SDK de Alma en Max ($99/mes) proporciona una capa cognitiva completa (memoria + Soul + ensamblado de contexto) con una API HTTP. La edición comunitaria self-hosted de Zep también es gratis para este caso pero espera inversión de ingeniería antes de que se entregue la primera feature.

¿Cuándo debería elegir Zep?

Elige Zep si eres un equipo de ingeniería construyendo un producto de agente de IA donde el razonamiento temporal de entidades es central en la experiencia — una IA de soporte al cliente siguiendo cuentas, un agente de investigación siguiendo hipótesis durante semanas, una automatización de workflow empresarial que necesita saber exactamente cuándo cambió un hecho y por qué. El modelo de grafo compensa cuando «muéstrame el estado de la entidad X en la fecha Y» es una query real que necesitas responder. Escribirás código de integración y probablemente una UI envolvente; ese es el trato.

¿Cuándo debería elegir Alma?

Elige Alma si quieres usar memoria de IA en lugar de construir infraestructura. Regístrate, empieza a chatear y la memoria funciona. Si además trabajas en Cursor / Claude Desktop / VSCode / Windsurf, instala el MCP server (gratis) y la misma memoria te sigue. Elige Alma si quieres una identidad de IA estructurada (Soul Engine), estudios creativos incluidos o una suscripción asequible para un único usuario. Los desarrolladores que quieran embebber Alma en sus propias apps obtienen el SDK, el MCP server y la REST API en el plan Max ($99/mes) — una capa cognitiva completa en lugar de solo un backend de memoria.

Preguntas frecuentes

¿Alma tiene consciencia temporal? Sí, pero con un modelo distinto. Las memorias llevan timestamps de creación y último acceso; los episodios son resúmenes de conversación ordenados temporalmente; el decaimiento por importancia (la puntuación de 5 factores incluye recencia 10%) deja que las memorias antiguas se desvanezcan de forma natural. No hay lenguaje de query de grafo para «estado en el momento T» — esa es la feature diferenciada de Zep, no de Alma.

¿Alma tiene un grafo de conocimiento de entidades? Sí, internamente. La extracción de entidades corre de forma heurística en cada creación de memoria (sin coste LLM extra en lectura) y alimenta el grafo usado en el momento de recuperación. No es consultable como grafo por el usuario hoy; el modelo expuesto al usuario sigue siendo «memorias / episodios / procedimientos».

¿Puede Alma sustituir a Zep en mi producto de agente de IA? A veces. Si tu agente es orientado a usuario final y las necesidades de memoria son «recordar preferencias, decisiones y contexto entre sesiones», el SDK + REST API de Alma en Max te dan lo que necesitas sin construir una envoltura. Si necesitas queries explícitas de grafo temporal, Zep es la herramienta correcta.

¿Es Alma open source? No. Alma es un SaaS hospedado. Zep ofrece una edición comunitaria open source que puedes self-hostear.

Conclusión

Zep está hecho para equipos de ingeniería lanzando agentes de IA que necesitan razonamiento explícito de grafo temporal. Alma es la herramienta correcta cuando quieres un producto de memoria completo (chat, Soul Engine, MCP, estudios creativos) sin trabajo de infraestructura, o cuando necesitas una capa cognitiva para tu propia app sin escribir el modelo tipado de memoria y el Soul Engine tú mismo. El plan Starter ($14/mes) te muestra el producto de principio a fin en cinco minutos.

Ver planes · Ver planes · Documentos para desarrolladores y SDK

See plans