Alma vs Letta (MemGPT)

Atualizado em maio de 2026

Letta (antigo MemGPT) é um framework open-source para construir agentes de IA stateful. Sua memória tiered (core / archival / recall) é inspirada na memória virtual de sistema operacional: o próprio agente decide o que lembrar e esquecer. Alma é um SaaS de produção onde o usuário controla a memória: arquitetura tipada em 3 camadas (memories / episodes / procedures), identidade Soul Engine, UI completa, MCP server, estúdios criativos.

O que é Letta (MemGPT)?

Letta é a evolução em grau de produção do MemGPT, o paper de pesquisa de 2023 que propôs tratar a janela de contexto de um LLM como o análogo OS de RAM e usar "memory paging" para trocar fatos menos relevantes para dentro e fora. O framework é entregue open-source sob Apache 2.0 e é projetado para times de engenharia construindo agentes de IA autônomos — agentes que agem ao longo de vários passos sem um humano no loop, que mantêm estado entre sessões e que precisam raciocinar sobre sua própria memória.

A memória tiered da Letta tem três camadas: core memory (sempre no contexto, editada pelo próprio agente via tool calls), archival memory (vector-searchable, consultada pelo agente) e recall memory (histórico completo de conversa). A característica definidora é self-management: o agente decide o que é promovido para core, o que vai para archival, o que é esquecido. Há também Letta Cloud (tier pago hospedado) e uma UI web focada em devs para construir e testar agentes.

O que é Alma?

Alma é um produto completo de memória persistente para usuários finais e desenvolvedores. Usuários finais se cadastram em alma.olivares.ai, conversam com Anthropic Claude (Haiku, Sonnet, Opus 4.7 com contexto de 1M tokens) e a camada de memória captura fatos, preferências e decisões automaticamente. O Soul Engine cuida da identidade. Estúdios de Image, Video, Music e Code vêm no bundle. Desenvolvedores também podem alcançar a mesma memória via MCP server, JavaScript SDK e REST API no plano Max.

A memória é estruturada em três camadas (memories / episodes / procedures), cada uma tipada, cada uma recuperada de forma diferente. Os planos pagos começam em $14/mo (Starter) com o Soul Engine completo e memories ilimitadas.

Como diferem na arquitetura de memória?

As duas têm três camadas, mas a filosofia é oposta. Os tiers da Letta são sobre onde os dados vivem em relação à janela de contexto — core (sempre dentro), archival (a uma tool call de distância), recall (todo o histórico). O agente move dados entre tiers usando tools embutidas.

As camadas da Alma são sobre que tipo de conhecimento é — memories (fatos), episodes (eventos), procedures (fluxos). Cada camada tem suas próprias regras de recuperação e ciclo de vida. O usuário pode ler, editar, pontuar e deletar qualquer coisa em qualquer camada. A montagem de contexto as compõe no system prompt antes de cada chat — o usuário não precisa pensar nisso, mas pode inspecionar tudo.

O eixo de controle importa mais. Letta é agent-managed: o próprio LLM é o curador. Isso é poderoso para agentes autônomos mas mais difícil de prever — seu agente pode decidir que sua preferência de stack não é importante e arquivá-la. Alma é user-controlled: importance, confidence, category e CRUD completo vivem nas mãos do usuário. Previsível, debugável, exportável.

Como diferem no usuário-alvo?

Letta é para times de engenharia construindo agentes de IA autônomos — produtos onde a IA roda sem um humano no loop, toma decisões e precisa do modelo de memória estilo OS para se manter coerente em horizontes longos. O framework é open source para que você possa ler cada linha, forkar e auto-hospedar.

Alma é para usuários finais que querem IA com memória entre as ferramentas em que já trabalham — Cursor, Claude Desktop, VSCode, Windsurf, o app web da Alma — e para desenvolvedores que querem uma camada cognitiva completa para embedar nos próprios produtos sem ter que escrever uma do zero. O trade-off é SaaS de código fechado, mas com a velocidade e estabilidade que vêm junto.

Comparação feature por feature

FeatureLetta (MemGPT)Alma
Usuário-alvoDesenvolvedores construindo agentes de IA autônomosUsuários finais + desenvolvedores
Modelo de memóriaTiered por localização: core + archival + recall (agent-managed)Tipada por forma: memories + episodes + procedures (user-controlled)
Curadoria da memóriaAgente decide via tool calls — previsibilidade varia por modeloUsuário controla: CRUD completo, categorias, importance, pontuação, busca
Produto end-userNão — SDK / framework para devs + dashboard Letta CloudSim — app web completo com chat, streaming, tools, anexos de arquivo
Identidade de IAPersona do agente via system prompt + core memorySoul Engine — 13 blocos de identidade versionados em seções XML
Alcance cross-toolO que você construir em cima — sem MCP / VSCode fora da caixaMCP (Claude Desktop / Cursor / Windsurf), VSCode, SDK, REST API
Ferramentas criativasNenhumaEstúdios Image / Video / Music / Code em Pro e Max
Open sourceSim (Apache 2.0)Não (SaaS hospedado)
Self-hostSimNão
PreçoFree (self-hosted) · Letta Cloud (tiers pagos)Starter $14/mo · Pro $29/mo · Max $99/mo

Comparação de preços

Letta self-hosted é gratuito se você bancar o esforço de engenharia: um servidor, um banco de dados, deployment, monitoramento, atualizações. Letta Cloud é a alternativa gerenciada com tiers pagos baseados em uso. O preço da Alma é fixo e amigável a usuário final: Starter $14/mo (memories ilimitadas, Haiku + Sonnet), Pro $29/mo (adiciona Opus 4.7 com contexto de 1M tokens, environments ilimitados e estúdios criativos), Max $99/mo (adiciona REST API, MCP server, extensão VSCode, SDK e BYOK). Faturamento anual é "pague 10 meses, ganhe 12" em todo plano pago.

Fluxos comuns na prática

Construir um agente autônomo de longa duração. Um time está construindo um agente de IA que roda ao longo de vários passos sem intervenção humana — agentes de pesquisa, agentes de ops, automação multi-passo. A memória tiered estilo OS na Letta (core / archival / recall) é projetada exatamente para isso: o agente se auto-gerencia o que fica no contexto. O modelo de 3 camadas controlado pelo usuário da Alma é conversacional por padrão; pode dirigir um loop autônomo via SDK, mas a filosofia de curadoria é oposta — previsível, exposta, editada pelo usuário em vez do agente.

Usuário final quer memória entre as ferramentas que já usa. Letta é para times de engenharia; não há produto end-user. Alma é o produto end-user. Cadastre-se em alma.olivares.ai, conecte o MCP server em cinco minutos e cada cliente de IA suportado (Claude Desktop, Cursor, Windsurf, Claude Code, VSCode) tem a mesma memória. O usuário nunca pensa em paging de archival memory ou recall queues; Alma cuida da recuperação automaticamente.

Exigência de open-source, self-host. Um time tem uma exigência rígida de que todos os componentes rodem dentro da sua própria infraestrutura com fonte auditável. Letta é a escolha certa — Apache 2.0, fonte completa, rode onde quiser. Alma é um SaaS hospedado e não é a ferramenta certa quando self-hosting é mandatório.

Quando devo escolher Letta?

Escolha Letta se você está construindo agentes de IA autônomos — agentes de longa duração, multi-passo, que tomam decisões sem humano — e a abstração de memória tiered estilo OS mapeia limpamente no seu problema. Escolha Letta se open source é não-negociável, se você quer auto-hospedar o stack inteiro ou se seu time de engenharia tem banda para estender e operar o framework. A linhagem de pesquisa da Letta (o paper original do MemGPT) e a comunidade ativa são ativos reais quando você precisa empurrar o framework em direções customizadas.

Quando devo escolher Alma?

Escolha Alma se você quer usar IA com memória em vez de construir infraestrutura para agentes autônomos. Cadastre-se em alma.olivares.ai, comece a conversar e a memória funciona. Se você também trabalha em Cursor, Claude Desktop, VSCode ou Windsurf, instale o MCP server (gratuito) e a mesma memória te acompanha. Escolha Alma se você quer uma identidade de IA estruturada e previsível (Soul Engine), se precisa de controle completo de export e edição sobre o que a IA sabe, ou se quer estúdios criativos no bundle. Desenvolvedores que queiram uma camada cognitiva completa no próprio produto (memories + episodes + procedures + Soul + montagem de contexto pontuada) recebem SDK, MCP server e REST API no plano Max.

Perguntas frequentes

A memória tiered da Letta e a memória em 3 camadas da Alma são a mesma coisa? Não. Os tiers da Letta descrevem onde os dados vivem em relação à janela de contexto (core / archival / recall). As camadas da Alma descrevem que tipo de conhecimento é (fatos / eventos / fluxos). Eixos diferentes, modelos de curadoria diferentes.

Alma pode rodar como agente autônomo? Não nativamente no sentido Letta — o chat da Alma é conversacional, com o usuário dirigindo cada turno. A memória se acumula dessas conversas. Se você quer um loop de agente totalmente autônomo, construa em cima do SDK / API da Alma; Alma te dá a camada cognitiva, você constrói o loop do agente.

Alma é open source? Não. Alma é um SaaS hospedado. Letta é open source sob Apache 2.0 e é a escolha certa se open source é exigência rígida.

Posso migrar minhas memories Letta para Alma? Não via import de um clique hoje. A diferença de forma (tiers Letta vs camadas tipadas Alma) significa que precisaria de uma conversão estruturada. A REST API no Max te deixa escrever o import sozinho se você tem um armazenamento archival Letta e quer trazê-lo.

Ver planos · Ver planos · Docs para desenvolvedores e SDK

See plans