Atualizado em maio de 2026
Letta é a evolução para produção do MemGPT, o artigo de investigação de 2023 que propôs tratar a janela de contexto de um LLM como o equivalente OS da RAM e utilizar "paginação de memória" para trocar factos menos relevantes para dentro e para fora. A framework é open source sob Apache 2.0 e foi desenhada para equipas de engenharia que constroem agentes de IA autónomos — agentes que atuam em vários passos sem um humano no ciclo, que mantêm estado entre sessões e que precisam de raciocinar sobre a sua própria memória.
A memória escalonada do Letta tem três camadas: core memory (sempre em contexto, editada pelo próprio agente via chamadas a ferramentas), archival memory (pesquisável por vetor, consultada pelo agente) e recall memory (histórico completo de conversa). A característica definidora é a autogestão: o agente decide o que é promovido para core, o que é arquivado, o que é esquecido. Existe também o Letta Cloud (camada paga alojada) e uma UI web focada em programadores para construir e testar agentes.
Alma é um produto completo de memória persistente para utilizadores finais e programadores. Os utilizadores finais registam-se em alma.olivares.ai, conversam com Anthropic Claude (Haiku, Sonnet, Opus 4.7 com 1M de contexto) e a camada de memória captura factos, preferências e decisões automaticamente. O Soul Engine trata da identidade. Os estúdios Image, Video, Music e Code estão incluídos. Os programadores podem também alcançar a mesma memória através do servidor MCP, do JavaScript SDK e da REST API no plano Max.
A memória está estruturada em três camadas (memórias / episódios / procedimentos), cada uma tipada, cada uma recuperada de forma diferente. Os planos pagos começam em $14/mês (Starter) com o Soul Engine completo e memórias ilimitadas.
Ambos têm três camadas, mas a filosofia é oposta. As camadas do Letta são sobre onde os dados vivem em relação à janela de contexto — core (sempre dentro), archival (a uma chamada de distância), recall (todo o histórico). O agente move dados entre camadas utilizando ferramentas integradas.
As camadas da Alma são sobre que tipo de conhecimento é — memórias (factos), episódios (eventos), procedimentos (fluxos de trabalho). Cada camada tem as suas próprias regras de recuperação e ciclo de vida. O utilizador pode ler, editar, pontuar e eliminar qualquer coisa em qualquer camada. A montagem de contexto compõe-nas no system prompt antes de cada chat — o utilizador não tem de pensar nisso, mas pode inspecionar tudo.
O eixo de controlo é o que mais importa. Letta é gerido pelo agente: o próprio LLM é o curador. Isto é poderoso para agentes autónomos mas mais difícil de prever — o seu agente pode decidir que a sua preferência de stack não é importante e arquivá-la. A Alma é controlada pelo utilizador: importância, confiança, categoria e CRUD completo vivem nas mãos do utilizador. Previsível, debugável, exportável.
Letta é para equipas de engenharia que constroem agentes de IA autónomos — produtos onde a IA corre sem um humano no ciclo, toma decisões e precisa do modelo de memória ao estilo OS para se manter coerente em horizontes longos. A framework é open source para que possa ler cada linha, fazer fork e alojar internamente.
A Alma é para utilizadores finais que querem IA com memória entre as ferramentas em que já trabalham — Cursor, Claude Desktop, VSCode, Windsurf, a aplicação web da Alma — e para programadores que querem uma camada cognitiva completa para integrar nos seus próprios produtos sem terem de escrever uma do zero. A contrapartida é SaaS de código fechado, mas com a velocidade e estabilidade que isso traz.
| Funcionalidade | Letta (MemGPT) | Alma |
|---|---|---|
| Utilizador-alvo | Programadores a construir agentes de IA autónomos | Utilizadores finais + programadores |
| Modelo de memória | Escalonado por localização: core + archival + recall (gerido pelo agente) | Tipado por forma: memórias + episódios + procedimentos (controlado pelo utilizador) |
| Curadoria de memória | Agente decide via chamadas a ferramentas — previsibilidade varia por modelo | Utilizador controla: CRUD completo, categorias, importância, pontuação, pesquisa |
| Produto para utilizador final | Não — SDK / framework de programador + painel Letta Cloud | Sim — aplicação web completa com chat, streaming, ferramentas, anexos de ficheiros |
| Identidade de IA | Persona do agente via system prompt + core memory | Soul Engine — 13 blocos versionados de identidade em secções XML |
| Alcance entre ferramentas | O que construir por cima — sem MCP / VSCode de origem | MCP (Claude Desktop / Cursor / Windsurf), VSCode, SDK, REST API |
| Ferramentas criativas | Nenhuma | Estúdios Image / Video / Music / Code em Pro e Max |
| Open source | Sim (Apache 2.0) | Não (SaaS alojado) |
| Auto-alojado | Sim | Não |
| Preço | Gratuito (auto-alojado) · Letta Cloud (camadas pagas) | Starter $14/mês · Pro $29/mês · Max $99/mês |
Letta auto-alojado é gratuito se trouxer o esforço de engenharia: um servidor, uma base de dados, deployment, monitorização, atualizações. O Letta Cloud é a alternativa gerida com camadas pagas baseadas em utilização. O preço da Alma é fixo e adequado ao utilizador final: Starter $14/mês (memórias ilimitadas, Haiku + Sonnet), Pro $29/mês (acrescenta Opus 4.7 com 1M de contexto, Environments ilimitados e estúdios criativos), Max $99/mês (acrescenta REST API, servidor MCP, extensão VSCode, SDK e BYOK). A faturação anual é "pague 10 meses, receba 12" em todos os planos pagos.
Construir um agente autónomo de longa duração. Uma equipa está a construir um agente de IA que corre em vários passos sem intervenção humana — agentes de investigação, agentes de operações, automatização multi-passo. A memória escalonada ao estilo OS no Letta (core / archival / recall) foi desenhada exatamente para isto: o agente autogere o que fica em contexto. O modelo de 3 camadas controlado pelo utilizador da Alma é conversacional por defeito; pode conduzir um ciclo autónomo via o SDK, mas a filosofia de curadoria é oposta — previsível, exposta, editada pelo utilizador em vez de pelo agente.
Utilizador final quer memória entre as ferramentas que já utiliza. Letta é para equipas de engenharia; não há produto para utilizador final. A Alma é o produto para utilizador final. Registe-se em alma.olivares.ai, ligue o servidor MCP em cinco minutos, e cada cliente de IA suportado (Claude Desktop, Cursor, Windsurf, Claude Code, VSCode) tem a mesma memória. O utilizador nunca pensa em paginação de archival memory ou filas de recall; a Alma trata da recuperação automaticamente.
Requisito de open source, auto-alojamento. Uma equipa tem um requisito duro de que todos os componentes corram dentro da sua própria infraestrutura com código auditável. Letta é a escolha certa — Apache 2.0, código completo, corra-o onde quiser. A Alma é SaaS alojado e não é a ferramenta certa quando o auto-alojamento é obrigatório.
Escolha Letta se está a construir agentes de IA autónomos — agentes de longa duração, multi-passo, que tomam decisões sem um humano — e a abstração de memória escalonada ao estilo OS mapeia limpamente no seu problema. Escolha Letta se o open source for inegociável, se quiser auto-alojar toda a stack, ou se a sua equipa de engenharia tem largura de banda para estender e operar a framework. A linhagem de investigação do Letta (o artigo MemGPT original) e a comunidade ativa são verdadeiros ativos quando precisa de empurrar a framework em direções personalizadas.
Escolha a Alma se quer usar IA com memória em vez de construir infraestrutura para agentes autónomos. Registe-se em alma.olivares.ai, comece a conversar, e a memória funciona. Se também trabalha em Cursor, Claude Desktop, VSCode ou Windsurf, instale o servidor MCP (gratuito) e a mesma memória segue-o. Escolha a Alma se quer uma identidade de IA estruturada e previsível (Soul Engine), se precisa de controlo completo de exportação e edição sobre o que a IA sabe, ou se quer estúdios criativos incluídos. Programadores que querem uma camada cognitiva completa no seu próprio produto (memórias + episódios + procedimentos + Soul + montagem de contexto pontuada) obtêm o SDK, servidor MCP e REST API no plano Max.
A memória escalonada do Letta e a memória de 3 camadas da Alma são a mesma coisa? Não. As camadas do Letta descrevem onde os dados vivem em relação à janela de contexto (core / archival / recall). As camadas da Alma descrevem que tipo de conhecimento é (factos / eventos / fluxos de trabalho). Eixos diferentes, modelos de curadoria diferentes.
A Alma pode correr como um agente autónomo? Não nativamente no sentido do Letta — o chat da Alma é conversacional, com o utilizador a conduzir cada turno. A memória acumula-se a partir dessas conversas. Se quiser um ciclo de agente totalmente autónomo, construa-o sobre o SDK / API da Alma; a Alma dá-lhe a camada cognitiva, o utilizador constrói o ciclo do agente.
A Alma é open source? Não. A Alma é SaaS alojado. Letta é open source sob Apache 2.0 e é a escolha certa se open source é um requisito duro.
Posso migrar as minhas memórias do Letta para a Alma? Não via uma importação a um clique hoje. A diferença de forma (camadas do Letta vs camadas tipadas da Alma) significa que seria necessária uma conversão estruturada. A REST API em Max permite-lhe escrever a importação se tiver um arquivo Letta archival e o quiser trazer.
Ver planos · Ver planos · Documentação para programadores e SDK