Alma vs Letta (MemGPT)

Q: La memoria a livelli di Letta e la memoria a 3 livelli di Alma sono la stessa cosa?

No. I tier di Letta descrivono dove vivono i dati rispetto alla finestra di contesto (core / archival / recall). I livelli di Alma descrivono che tipo di conoscenza è (fatti / eventi / workflow). Assi diversi, modelli di curatela diversi.

Aggiornato a maggio 2026

Letta (precedentemente MemGPT) è un framework open-source per costruire agenti AI stateful. La sua memoria a livelli (core / archival / recall) è ispirata alla memoria virtuale del sistema operativo: l'agente stesso decide cosa ricordare e cosa dimenticare. Alma è un SaaS di produzione in cui l'utente controlla la memoria: architettura tipizzata a 3 livelli (memorie / episodi / procedure), identità Soul Engine, UI completa, server MCP, studi creativi.

Cos'è Letta (MemGPT)?

Letta è l'evoluzione di livello di produzione di MemGPT, il paper di ricerca del 2023 che proponeva di trattare la finestra di contesto di un LLM come l'analogo OS della RAM e di usare il «paging della memoria» per scambiare fatti meno rilevanti dentro e fuori. Il framework distribuisce open-source sotto Apache 2.0 ed è progettato per team di ingegneria che costruiscono agenti AI autonomi — agenti che agiscono in più passi senza umani nel loop, che mantengono lo stato tra le sessioni e che hanno bisogno di ragionare sulla propria memoria.

La memoria a livelli di Letta ha tre layer: core memory (sempre nel contesto, modificata dall'agente stesso tramite chiamate di strumento), archival memory (ricercabile vettorialmente, interrogata dall'agente) e recall memory (cronologia completa delle conversazioni). Il tratto distintivo è la self-management: l'agente decide cosa viene promosso a core, cosa viene archiviato, cosa viene dimenticato. C'è anche Letta Cloud (tier ospitato a pagamento) e una web UI orientata agli sviluppatori per costruire e testare agenti.

Cos'è Alma?

Alma è un prodotto completo di memoria persistente per utenti finali e sviluppatori. Gli utenti finali si registrano su alma.olivares.ai, chattano con Anthropic Claude (Haiku, Sonnet, Opus 4.7 con contesto da 1M token) e il livello di memoria cattura automaticamente fatti, preferenze e decisioni. Il Soul Engine gestisce l'identità. Studi Image, Video, Music e Code sono inclusi. Gli sviluppatori possono anche raggiungere la stessa memoria tramite il server MCP, il JavaScript SDK e la REST API sul piano Max.

La memoria è strutturata in tre livelli (memorie / episodi / procedure), ciascuno tipizzato, ciascuno recuperato diversamente. I piani a pagamento partono da $14/mese (Starter) con il Soul Engine completo con memorie illimitate.

In cosa differiscono sull'architettura di memoria?

Entrambi hanno tre livelli, ma la filosofia è opposta. I tier di Letta riguardano dove vivono i dati rispetto alla finestra di contesto: core (sempre dentro), archival (a una chiamata di strumento di distanza), recall (tutta la cronologia). L'agente sposta i dati tra i tier usando strumenti integrati.

I livelli di Alma riguardano che tipo di conoscenza è: memorie (fatti), episodi (eventi), procedure (workflow). Ogni livello ha le proprie regole di recupero e ciclo di vita. L'utente può leggere, modificare, valutare ed eliminare qualsiasi cosa in qualsiasi livello. L'assemblaggio del contesto li compone nel system prompt prima di ogni chat: l'utente non deve pensarci, ma può ispezionare tutto.

L'asse del controllo conta di più. Letta è gestita dall'agente: l'LLM stesso è il curatore. Questo è potente per agenti autonomi ma più difficile da prevedere: il Suo agente potrebbe decidere che la Sua preferenza di stack non è importante e archiviarla. Alma è controllata dall'utente: importanza, confidenza, categoria e CRUD completo vivono nelle mani dell'utente. Prevedibile, debuggabile, esportabile.

In cosa differiscono per utente target?

Letta è per team di ingegneria che costruiscono agenti AI autonomi: prodotti in cui l'AI funziona senza un umano nel loop, prende decisioni e ha bisogno del modello di memoria in stile OS per restare coerente su orizzonti lunghi. Il framework è open source quindi può leggere ogni riga, forkarlo e ospitarlo autonomamente.

Alma è per utenti finali che vogliono AI con memoria attraverso gli strumenti in cui già lavorano — Cursor, Claude Desktop, VSCode, Windsurf, la web app Alma — e per sviluppatori che vogliono un livello cognitivo completo da incorporare nei propri prodotti senza scriverlo da zero. Il trade-off è SaaS closed-source, ma con la velocità e la stabilità che ne derivano.

Confronto funzione per funzione

Funzione	Letta (MemGPT)	Alma
Utente target	Sviluppatori che costruiscono agenti AI autonomi	Utenti finali + sviluppatori
Modello di memoria	A livelli per posizione: core + archival + recall (gestita dall'agente)	Tipizzata per forma: memorie + episodi + procedure (controllata dall'utente)
Curatela della memoria	L'agente decide tramite chiamate di strumento — la prevedibilità varia per modello	L'utente controlla: CRUD completo, categorie, importanza, scoring, ricerca
Prodotto per utente finale	No — SDK / framework per sviluppatori + dashboard Letta Cloud	Sì — web app completa con chat, streaming, strumenti, allegati file
Identità AI	Persona dell'agente tramite system prompt + core memory	Soul Engine — 13 blocchi di identità versionati in sezioni XML
Portata cross-tool	Qualsiasi cosa costruisca sopra — niente MCP / VSCode out of the box	MCP (Claude Desktop / Cursor / Windsurf), VSCode, SDK, REST API
Strumenti creativi	Nessuno	Studi Image / Video / Music / Code in Pro e Max
Open source	Sì (Apache 2.0)	No (SaaS ospitato)
Self-host	Sì	No
Prezzi	Free (self-hosted) · Letta Cloud (tier a pagamento)	Starter $14/mese · Pro $29/mese · Max $99/mese

Confronto dei prezzi

Letta self-hosted è gratuita se porta lo sforzo ingegneristico: un server, un database, deployment, monitoraggio, aggiornamenti. Letta Cloud è l'alternativa gestita con tier a pagamento basati sull'utilizzo. I prezzi di Alma sono fissi e adatti all'utente finale: Starter $14/mese (memorie illimitate, Haiku + Sonnet), Pro $29/mese (aggiunge Opus 4.7 con contesto da 1M token, ambienti illimitati e studi creativi), Max $99/mese (aggiunge REST API, server MCP, estensione VSCode, SDK e BYOK). La fatturazione annuale è «paghi 10 mesi, ne ottieni 12» su ogni piano a pagamento.

Flussi di lavoro comuni nella pratica

Costruire un agente autonomo a lunga esecuzione. Un team sta costruendo un agente AI che funziona in più passi senza intervento umano: agenti di ricerca, agenti ops, automazione multi-step. La memoria a livelli in stile OS in Letta (core / archival / recall) è progettata esattamente per questo: l'agente auto-gestisce ciò che resta nel contesto. Il modello a 3 livelli controllato dall'utente di Alma è conversazionale per default; può guidare un loop autonomo tramite l'SDK, ma la filosofia di curatela è opposta — prevedibile, esposta, modificata dall'utente invece che dall'agente.

L'utente finale vuole memoria attraverso gli strumenti che già usa. Letta è per team di ingegneria; non c'è prodotto per utente finale. Alma è il prodotto per utente finale. Si registri su alma.olivares.ai, colleghi il server MCP in cinque minuti e ogni client AI supportato (Claude Desktop, Cursor, Windsurf, Claude Code, VSCode) ha la stessa memoria. L'utente non pensa mai al paging della memoria archival o alle code di recall; Alma gestisce il recupero automaticamente.

Requisito open-source, self-host. Un team ha un requisito rigido che tutti i componenti girino dentro la propria infrastruttura con sorgente verificabile. Letta è la scelta giusta: Apache 2.0, sorgente completo, lo esegue dove vuole. Alma è un SaaS ospitato e non è lo strumento giusto quando il self-hosting è obbligatorio.

Quando dovrei scegliere Letta?

Scelga Letta se sta costruendo agenti AI autonomi — a lunga esecuzione, multi-step, agenti che prendono decisioni senza un umano — e l'astrazione di memoria a livelli in stile OS si mappa pulitamente sul Suo problema. Scelga Letta se l'open source è non negoziabile, se vuole ospitare autonomamente l'intero stack o se il Suo team di ingegneria ha la larghezza di banda per estendere e operare il framework. Il lignaggio di ricerca di Letta (il paper originale MemGPT) e la community attiva sono asset reali quando deve spingere il framework in direzioni personalizzate.

Quando dovrei scegliere Alma?

Scelga Alma se vuole usare AI con memoria invece di costruire infrastruttura per agenti autonomi. Si registri su alma.olivares.ai, inizi a chattare e la memoria funziona. Se lavora anche in Cursor, Claude Desktop, VSCode o Windsurf, installi il server MCP (gratuito) e la stessa memoria La segue. Scelga Alma se vuole un'identità AI strutturata e prevedibile (Soul Engine), se Le serve controllo completo di esportazione e modifica su ciò che l'AI sa, o se vuole studi creativi inclusi. Gli sviluppatori che vogliono un livello cognitivo completo nel proprio prodotto (memorie + episodi + procedure + Soul + assemblaggio del contesto valutato) ottengono SDK, server MCP e REST API sul piano Max.

Domande frequenti

La memoria a livelli di Letta e la memoria a 3 livelli di Alma sono la stessa cosa? No. I tier di Letta descrivono dove vivono i dati rispetto alla finestra di contesto (core / archival / recall). I livelli di Alma descrivono che tipo di conoscenza è (fatti / eventi / workflow). Assi diversi, modelli di curatela diversi.

Alma può funzionare come agente autonomo? Non nativamente nel senso di Letta: la chat di Alma è conversazionale, con l'utente che guida ogni turno. La memoria si accumula da quelle conversazioni. Se vuole un loop di agente completamente autonomo, lo costruisca sull'SDK / API di Alma; Alma Le dà il livello cognitivo, Lei costruisce il loop di agente.

Alma è open source? No. Alma è un SaaS ospitato. Letta è open source sotto Apache 2.0 ed è la scelta giusta se l'open source è un requisito rigido.

Posso migrare le mie memorie Letta in Alma? Non tramite un'importazione con un clic oggi. La differenza di forma (tier Letta vs livelli tipizzati Alma) significa che richiederebbe una conversione strutturata. La REST API su Max Le permette di scrivere l'importazione da solo se ha un archivio archival Letta e vuole portarlo.

Vedi i piani · Vedi i piani · Documentazione sviluppatori e SDK

See plans