Alma vs Letta (MemGPT)

Actualizado en mayo de 2026

Letta (antes MemGPT) es un framework open source para construir agentes de IA con estado. Su memoria por niveles (core / archival / recall) está inspirada en la memoria virtual de los sistemas operativos: el propio agente decide qué recordar y qué olvidar. Alma es un SaaS de producción donde el usuario controla la memoria: arquitectura tipada de 3 capas (memorias / episodios / procedimientos), identidad Soul Engine, UI completa, MCP server, estudios creativos.

¿Qué es Letta (MemGPT)?

Letta es la evolución de calidad de producción de MemGPT, el paper de investigación de 2023 que propuso tratar la ventana de contexto de un LLM como el análogo OS de la RAM y usar «paginación de memoria» para intercambiar hechos menos relevantes dentro y fuera. El framework se entrega open source bajo Apache 2.0 y está diseñado para equipos de ingeniería construyendo agentes de IA autónomos — agentes que actúan en múltiples pasos sin un humano en el bucle, que mantienen estado entre sesiones y que necesitan razonar sobre su propia memoria.

La memoria por niveles de Letta tiene tres capas: core memory (siempre en contexto, editada por el propio agente vía tool calls), archival memory (búsqueda vectorial, consultada por el agente) y recall memory (historial completo de conversación). El rasgo definitorio es la auto-gestión: el agente decide qué se promociona a core, qué se archiva, qué se olvida. También hay Letta Cloud (tier hospedado de pago) y una web UI orientada a desarrolladores para construir y probar agentes.

¿Qué es Alma?

Alma es un producto completo de memoria persistente para usuarios finales y desarrolladores. Los usuarios finales se registran en alma.olivares.ai, chatean con Anthropic Claude (Haiku, Sonnet, Opus 4.7 con 1M tokens de contexto) y la capa de memoria captura hechos, preferencias y decisiones automáticamente. El Soul Engine gestiona la identidad. Los estudios de Image, Video, Music y Code están incluidos. Los desarrolladores también pueden llegar a la misma memoria a través del MCP server, el SDK de JavaScript y la REST API en el plan Max.

La memoria está estructurada en tres capas (memorias / episodios / procedimientos), cada una tipada, cada una recuperada de forma distinta. Los planes de pago empiezan en $14/mes (Starter) con el Soul Engine completo y memorias ilimitadas.

¿En qué se diferencian respecto a la arquitectura de memoria?

Ambos tienen tres capas, pero la filosofía es opuesta. Los niveles de Letta van de dónde viven los datos respecto a la ventana de contexto — core (siempre dentro), archival (a una tool call), recall (todo el historial). El agente mueve datos entre niveles usando tools incorporadas.

Las capas de Alma van de qué tipo de conocimiento es — memorias (hechos), episodios (eventos), procedimientos (workflows). Cada capa tiene sus propias reglas de recuperación y ciclo de vida. El usuario puede leer, editar, puntuar y borrar cualquier cosa en cualquier capa. El ensamblado de contexto las compone en el system prompt antes de cada chat — el usuario no tiene que pensar en ello, pero puede inspeccionarlo todo.

El eje de control es el que más importa. Letta es gestionado por el agente: el propio LLM es el curador. Esto es potente para agentes autónomos pero más difícil de predecir — tu agente podría decidir que la preferencia de stack es poco importante y archivarla. Alma es controlada por el usuario: importancia, confianza, categoría y CRUD completo viven en manos del usuario. Predecible, depurable, exportable.

¿En qué se diferencian respecto al usuario objetivo?

Letta es para equipos de ingeniería construyendo agentes de IA autónomos — productos donde la IA corre sin humano en el bucle, toma decisiones y necesita el modelo de memoria estilo OS para mantenerse coherente en horizontes largos. El framework es open source para que puedas leer cada línea, forkearlo y self-hostearlo.

Alma es para usuarios finales que quieren IA con memoria entre las herramientas con las que ya trabajan — Cursor, Claude Desktop, VSCode, Windsurf, la web app de Alma — y para desarrolladores que quieren una capa cognitiva completa para embebber en sus propios productos sin escribir una desde cero. El trade-off es un SaaS de código cerrado, pero con la velocidad y estabilidad que eso conlleva.

Comparación característica a característica

CaracterísticaLetta (MemGPT)Alma
Usuario objetivoDesarrolladores construyendo agentes de IA autónomosUsuarios finales + desarrolladores
Modelo de memoriaPor niveles según ubicación: core + archival + recall (gestionada por el agente)Tipada por forma: memorias + episodios + procedimientos (controlada por el usuario)
Curado de memoriaEl agente decide vía tool calls — la predictibilidad varía según el modeloEl usuario controla: CRUD completo, categorías, importancia, puntuación, búsqueda
Producto de usuario finalNo — SDK / framework para desarrolladores + dashboard de Letta CloudSí — web app completa con chat, streaming, tools, adjuntos de fichero
Identidad de IAPersona del agente vía system prompt + core memorySoul Engine — 13 bloques versionados de identidad en secciones XML
Alcance entre herramientasLo que tú construyas encima — sin MCP / VSCode de serieMCP (Claude Desktop / Cursor / Windsurf), VSCode, SDK, REST API
Herramientas creativasNingunaEstudios Image / Video / Music / Code en Pro y Max
Open sourceSí (Apache 2.0)No (SaaS hospedado)
Self-hostNo
PrecioFree (self-hosted) · Letta Cloud (tiers de pago)Starter $14/mes · Pro $29/mes · Max $99/mes

Comparación de precios

Letta self-hosted es gratis si traes el esfuerzo de ingeniería: un servidor, una base de datos, despliegue, monitorización, actualizaciones. Letta Cloud es la alternativa gestionada con tiers de pago basados en uso. Los precios de Alma son fijos y orientados a usuario final: Starter $14/mes (memorias ilimitadas, Haiku + Sonnet), Pro $29/mes (añade Opus 4.7 con 1M tokens de contexto, environments ilimitados y estudios creativos), Max $99/mes (añade REST API, MCP server, extensión de VSCode, SDK y BYOK). La facturación anual es «paga 10 meses, recibe 12» en cada plan de pago.

Workflows habituales en la práctica

Construir un agente autónomo de larga duración. Un equipo construye un agente de IA que corre en múltiples pasos sin intervención humana — agentes de investigación, agentes de ops, automatización multi-paso. La memoria por niveles estilo OS de Letta (core / archival / recall) está diseñada exactamente para esto: el agente auto-gestiona qué se queda en contexto. El modelo de 3 capas controlado por el usuario de Alma es conversacional por defecto; puede impulsar un bucle autónomo vía el SDK, pero la filosofía de curado es opuesta — predecible, expuesta, editada por el usuario en lugar del agente.

El usuario final quiere memoria entre las herramientas que ya usa. Letta es para equipos de ingeniería; no hay producto de usuario final. Alma es el producto de usuario final. Regístrate en alma.olivares.ai, conecta el MCP server en cinco minutos y cada cliente de IA soportado (Claude Desktop, Cursor, Windsurf, Claude Code, VSCode) tiene la misma memoria. El usuario nunca piensa en paginación de archival memory ni en colas de recall; Alma gestiona la recuperación automáticamente.

Requisito de open source y self-host. Un equipo tiene el requisito duro de que todos los componentes corran dentro de su propia infraestructura con código auditable. Letta es la elección correcta — Apache 2.0, código completo, córrelo donde quieras. Alma es un SaaS hospedado y no es la herramienta correcta cuando el self-hosting es obligatorio.

¿Cuándo debería elegir Letta?

Elige Letta si estás construyendo agentes de IA autónomos — agentes de larga duración, multi-paso, que toman decisiones sin un humano — y la abstracción de memoria por niveles estilo OS mapea limpiamente sobre tu problema. Elige Letta si open source no es negociable, si quieres self-hostear todo el stack o si tu equipo de ingeniería tiene ancho de banda para extender y operar el framework. El linaje de investigación de Letta (el paper original de MemGPT) y su comunidad activa son activos reales cuando necesitas empujar el framework en direcciones a medida.

¿Cuándo debería elegir Alma?

Elige Alma si quieres usar IA con memoria en lugar de construir infraestructura para agentes autónomos. Regístrate en alma.olivares.ai, empieza a chatear y la memoria funciona. Si además trabajas en Cursor, Claude Desktop, VSCode o Windsurf, instala el MCP server (gratis) y la misma memoria te sigue. Elige Alma si quieres una identidad de IA estructurada y predecible (Soul Engine), si necesitas control completo de exportación y edición sobre lo que la IA sabe o si quieres estudios creativos incluidos. Los desarrolladores que quieran una capa cognitiva completa en su propio producto (memorias + episodios + procedimientos + Soul + ensamblado de contexto puntuado) obtienen el SDK, el MCP server y la REST API en el plan Max.

Preguntas frecuentes

¿La memoria por niveles de Letta y la de 3 capas de Alma son lo mismo? No. Los niveles de Letta describen dónde viven los datos respecto a la ventana de contexto (core / archival / recall). Las capas de Alma describen qué tipo de conocimiento es (hechos / eventos / workflows). Ejes distintos, modelos de curado distintos.

¿Puede Alma correr como un agente autónomo? No nativamente en el sentido de Letta — el chat de Alma es conversacional, con el usuario llevando cada turno. La memoria se acumula a partir de esas conversaciones. Si quieres un bucle de agente completamente autónomo, constrúyelo sobre el SDK / API de Alma; Alma te da la capa cognitiva, tú construyes el bucle del agente.

¿Es Alma open source? No. Alma es un SaaS hospedado. Letta es open source bajo Apache 2.0 y es la elección correcta si open source es un requisito duro.

¿Puedo migrar mis memorias de Letta a Alma? No vía un import de un clic hoy. La diferencia de forma (niveles de Letta vs capas tipadas de Alma) significa que necesitaría una conversión estructurada. La REST API en Max te permite escribir el import tú mismo si tienes un almacén archival de Letta y quieres traerlo.

Ver planes · Ver planes · Documentos para desarrolladores y SDK

See plans