Actualizado en mayo de 2026
Letta es la evolución de calidad de producción de MemGPT, el paper de investigación de 2023 que propuso tratar la ventana de contexto de un LLM como el análogo OS de la RAM y usar «paginación de memoria» para intercambiar hechos menos relevantes dentro y fuera. El framework se entrega open source bajo Apache 2.0 y está diseñado para equipos de ingeniería construyendo agentes de IA autónomos — agentes que actúan en múltiples pasos sin un humano en el bucle, que mantienen estado entre sesiones y que necesitan razonar sobre su propia memoria.
La memoria por niveles de Letta tiene tres capas: core memory (siempre en contexto, editada por el propio agente vía tool calls), archival memory (búsqueda vectorial, consultada por el agente) y recall memory (historial completo de conversación). El rasgo definitorio es la auto-gestión: el agente decide qué se promociona a core, qué se archiva, qué se olvida. También hay Letta Cloud (tier hospedado de pago) y una web UI orientada a desarrolladores para construir y probar agentes.
Alma es un producto completo de memoria persistente para usuarios finales y desarrolladores. Los usuarios finales se registran en alma.olivares.ai, chatean con Anthropic Claude (Haiku, Sonnet, Opus 4.7 con 1M tokens de contexto) y la capa de memoria captura hechos, preferencias y decisiones automáticamente. El Soul Engine gestiona la identidad. Los estudios de Image, Video, Music y Code están incluidos. Los desarrolladores también pueden llegar a la misma memoria a través del MCP server, el SDK de JavaScript y la REST API en el plan Max.
La memoria está estructurada en tres capas (memorias / episodios / procedimientos), cada una tipada, cada una recuperada de forma distinta. Los planes de pago empiezan en $14/mes (Starter) con el Soul Engine completo y memorias ilimitadas.
Ambos tienen tres capas, pero la filosofía es opuesta. Los niveles de Letta van de dónde viven los datos respecto a la ventana de contexto — core (siempre dentro), archival (a una tool call), recall (todo el historial). El agente mueve datos entre niveles usando tools incorporadas.
Las capas de Alma van de qué tipo de conocimiento es — memorias (hechos), episodios (eventos), procedimientos (workflows). Cada capa tiene sus propias reglas de recuperación y ciclo de vida. El usuario puede leer, editar, puntuar y borrar cualquier cosa en cualquier capa. El ensamblado de contexto las compone en el system prompt antes de cada chat — el usuario no tiene que pensar en ello, pero puede inspeccionarlo todo.
El eje de control es el que más importa. Letta es gestionado por el agente: el propio LLM es el curador. Esto es potente para agentes autónomos pero más difícil de predecir — tu agente podría decidir que la preferencia de stack es poco importante y archivarla. Alma es controlada por el usuario: importancia, confianza, categoría y CRUD completo viven en manos del usuario. Predecible, depurable, exportable.
Letta es para equipos de ingeniería construyendo agentes de IA autónomos — productos donde la IA corre sin humano en el bucle, toma decisiones y necesita el modelo de memoria estilo OS para mantenerse coherente en horizontes largos. El framework es open source para que puedas leer cada línea, forkearlo y self-hostearlo.
Alma es para usuarios finales que quieren IA con memoria entre las herramientas con las que ya trabajan — Cursor, Claude Desktop, VSCode, Windsurf, la web app de Alma — y para desarrolladores que quieren una capa cognitiva completa para embebber en sus propios productos sin escribir una desde cero. El trade-off es un SaaS de código cerrado, pero con la velocidad y estabilidad que eso conlleva.
| Característica | Letta (MemGPT) | Alma |
|---|---|---|
| Usuario objetivo | Desarrolladores construyendo agentes de IA autónomos | Usuarios finales + desarrolladores |
| Modelo de memoria | Por niveles según ubicación: core + archival + recall (gestionada por el agente) | Tipada por forma: memorias + episodios + procedimientos (controlada por el usuario) |
| Curado de memoria | El agente decide vía tool calls — la predictibilidad varía según el modelo | El usuario controla: CRUD completo, categorías, importancia, puntuación, búsqueda |
| Producto de usuario final | No — SDK / framework para desarrolladores + dashboard de Letta Cloud | Sí — web app completa con chat, streaming, tools, adjuntos de fichero |
| Identidad de IA | Persona del agente vía system prompt + core memory | Soul Engine — 13 bloques versionados de identidad en secciones XML |
| Alcance entre herramientas | Lo que tú construyas encima — sin MCP / VSCode de serie | MCP (Claude Desktop / Cursor / Windsurf), VSCode, SDK, REST API |
| Herramientas creativas | Ninguna | Estudios Image / Video / Music / Code en Pro y Max |
| Open source | Sí (Apache 2.0) | No (SaaS hospedado) |
| Self-host | Sí | No |
| Precio | Free (self-hosted) · Letta Cloud (tiers de pago) | Starter $14/mes · Pro $29/mes · Max $99/mes |
Letta self-hosted es gratis si traes el esfuerzo de ingeniería: un servidor, una base de datos, despliegue, monitorización, actualizaciones. Letta Cloud es la alternativa gestionada con tiers de pago basados en uso. Los precios de Alma son fijos y orientados a usuario final: Starter $14/mes (memorias ilimitadas, Haiku + Sonnet), Pro $29/mes (añade Opus 4.7 con 1M tokens de contexto, environments ilimitados y estudios creativos), Max $99/mes (añade REST API, MCP server, extensión de VSCode, SDK y BYOK). La facturación anual es «paga 10 meses, recibe 12» en cada plan de pago.
Construir un agente autónomo de larga duración. Un equipo construye un agente de IA que corre en múltiples pasos sin intervención humana — agentes de investigación, agentes de ops, automatización multi-paso. La memoria por niveles estilo OS de Letta (core / archival / recall) está diseñada exactamente para esto: el agente auto-gestiona qué se queda en contexto. El modelo de 3 capas controlado por el usuario de Alma es conversacional por defecto; puede impulsar un bucle autónomo vía el SDK, pero la filosofía de curado es opuesta — predecible, expuesta, editada por el usuario en lugar del agente.
El usuario final quiere memoria entre las herramientas que ya usa. Letta es para equipos de ingeniería; no hay producto de usuario final. Alma es el producto de usuario final. Regístrate en alma.olivares.ai, conecta el MCP server en cinco minutos y cada cliente de IA soportado (Claude Desktop, Cursor, Windsurf, Claude Code, VSCode) tiene la misma memoria. El usuario nunca piensa en paginación de archival memory ni en colas de recall; Alma gestiona la recuperación automáticamente.
Requisito de open source y self-host. Un equipo tiene el requisito duro de que todos los componentes corran dentro de su propia infraestructura con código auditable. Letta es la elección correcta — Apache 2.0, código completo, córrelo donde quieras. Alma es un SaaS hospedado y no es la herramienta correcta cuando el self-hosting es obligatorio.
Elige Letta si estás construyendo agentes de IA autónomos — agentes de larga duración, multi-paso, que toman decisiones sin un humano — y la abstracción de memoria por niveles estilo OS mapea limpiamente sobre tu problema. Elige Letta si open source no es negociable, si quieres self-hostear todo el stack o si tu equipo de ingeniería tiene ancho de banda para extender y operar el framework. El linaje de investigación de Letta (el paper original de MemGPT) y su comunidad activa son activos reales cuando necesitas empujar el framework en direcciones a medida.
Elige Alma si quieres usar IA con memoria en lugar de construir infraestructura para agentes autónomos. Regístrate en alma.olivares.ai, empieza a chatear y la memoria funciona. Si además trabajas en Cursor, Claude Desktop, VSCode o Windsurf, instala el MCP server (gratis) y la misma memoria te sigue. Elige Alma si quieres una identidad de IA estructurada y predecible (Soul Engine), si necesitas control completo de exportación y edición sobre lo que la IA sabe o si quieres estudios creativos incluidos. Los desarrolladores que quieran una capa cognitiva completa en su propio producto (memorias + episodios + procedimientos + Soul + ensamblado de contexto puntuado) obtienen el SDK, el MCP server y la REST API en el plan Max.
¿La memoria por niveles de Letta y la de 3 capas de Alma son lo mismo? No. Los niveles de Letta describen dónde viven los datos respecto a la ventana de contexto (core / archival / recall). Las capas de Alma describen qué tipo de conocimiento es (hechos / eventos / workflows). Ejes distintos, modelos de curado distintos.
¿Puede Alma correr como un agente autónomo? No nativamente en el sentido de Letta — el chat de Alma es conversacional, con el usuario llevando cada turno. La memoria se acumula a partir de esas conversaciones. Si quieres un bucle de agente completamente autónomo, constrúyelo sobre el SDK / API de Alma; Alma te da la capa cognitiva, tú construyes el bucle del agente.
¿Es Alma open source? No. Alma es un SaaS hospedado. Letta es open source bajo Apache 2.0 y es la elección correcta si open source es un requisito duro.
¿Puedo migrar mis memorias de Letta a Alma? No vía un import de un clic hoy. La diferencia de forma (niveles de Letta vs capas tipadas de Alma) significa que necesitaría una conversión estructurada. La REST API en Max te permite escribir el import tú mismo si tienes un almacén archival de Letta y quieres traerlo.
Ver planes · Ver planes · Documentos para desarrolladores y SDK