Aggiornato a maggio 2026
Letta è l'evoluzione di livello di produzione di MemGPT, il paper di ricerca del 2023 che proponeva di trattare la finestra di contesto di un LLM come l'analogo OS della RAM e di usare il «paging della memoria» per scambiare fatti meno rilevanti dentro e fuori. Il framework distribuisce open-source sotto Apache 2.0 ed è progettato per team di ingegneria che costruiscono agenti AI autonomi — agenti che agiscono in più passi senza umani nel loop, che mantengono lo stato tra le sessioni e che hanno bisogno di ragionare sulla propria memoria.
La memoria a livelli di Letta ha tre layer: core memory (sempre nel contesto, modificata dall'agente stesso tramite chiamate di strumento), archival memory (ricercabile vettorialmente, interrogata dall'agente) e recall memory (cronologia completa delle conversazioni). Il tratto distintivo è la self-management: l'agente decide cosa viene promosso a core, cosa viene archiviato, cosa viene dimenticato. C'è anche Letta Cloud (tier ospitato a pagamento) e una web UI orientata agli sviluppatori per costruire e testare agenti.
Alma è un prodotto completo di memoria persistente per utenti finali e sviluppatori. Gli utenti finali si registrano su alma.olivares.ai, chattano con Anthropic Claude (Haiku, Sonnet, Opus 4.7 con contesto da 1M token) e il livello di memoria cattura automaticamente fatti, preferenze e decisioni. Il Soul Engine gestisce l'identità. Studi Image, Video, Music e Code sono inclusi. Gli sviluppatori possono anche raggiungere la stessa memoria tramite il server MCP, il JavaScript SDK e la REST API sul piano Max.
La memoria è strutturata in tre livelli (memorie / episodi / procedure), ciascuno tipizzato, ciascuno recuperato diversamente. I piani a pagamento partono da $14/mese (Starter) con il Soul Engine completo con memorie illimitate.
Entrambi hanno tre livelli, ma la filosofia è opposta. I tier di Letta riguardano dove vivono i dati rispetto alla finestra di contesto: core (sempre dentro), archival (a una chiamata di strumento di distanza), recall (tutta la cronologia). L'agente sposta i dati tra i tier usando strumenti integrati.
I livelli di Alma riguardano che tipo di conoscenza è: memorie (fatti), episodi (eventi), procedure (workflow). Ogni livello ha le proprie regole di recupero e ciclo di vita. L'utente può leggere, modificare, valutare ed eliminare qualsiasi cosa in qualsiasi livello. L'assemblaggio del contesto li compone nel system prompt prima di ogni chat: l'utente non deve pensarci, ma può ispezionare tutto.
L'asse del controllo conta di più. Letta è gestita dall'agente: l'LLM stesso è il curatore. Questo è potente per agenti autonomi ma più difficile da prevedere: il Suo agente potrebbe decidere che la Sua preferenza di stack non è importante e archiviarla. Alma è controllata dall'utente: importanza, confidenza, categoria e CRUD completo vivono nelle mani dell'utente. Prevedibile, debuggabile, esportabile.
Letta è per team di ingegneria che costruiscono agenti AI autonomi: prodotti in cui l'AI funziona senza un umano nel loop, prende decisioni e ha bisogno del modello di memoria in stile OS per restare coerente su orizzonti lunghi. Il framework è open source quindi può leggere ogni riga, forkarlo e ospitarlo autonomamente.
Alma è per utenti finali che vogliono AI con memoria attraverso gli strumenti in cui già lavorano — Cursor, Claude Desktop, VSCode, Windsurf, la web app Alma — e per sviluppatori che vogliono un livello cognitivo completo da incorporare nei propri prodotti senza scriverlo da zero. Il trade-off è SaaS closed-source, ma con la velocità e la stabilità che ne derivano.
| Funzione | Letta (MemGPT) | Alma |
|---|---|---|
| Utente target | Sviluppatori che costruiscono agenti AI autonomi | Utenti finali + sviluppatori |
| Modello di memoria | A livelli per posizione: core + archival + recall (gestita dall'agente) | Tipizzata per forma: memorie + episodi + procedure (controllata dall'utente) |
| Curatela della memoria | L'agente decide tramite chiamate di strumento — la prevedibilità varia per modello | L'utente controlla: CRUD completo, categorie, importanza, scoring, ricerca |
| Prodotto per utente finale | No — SDK / framework per sviluppatori + dashboard Letta Cloud | Sì — web app completa con chat, streaming, strumenti, allegati file |
| Identità AI | Persona dell'agente tramite system prompt + core memory | Soul Engine — 13 blocchi di identità versionati in sezioni XML |
| Portata cross-tool | Qualsiasi cosa costruisca sopra — niente MCP / VSCode out of the box | MCP (Claude Desktop / Cursor / Windsurf), VSCode, SDK, REST API |
| Strumenti creativi | Nessuno | Studi Image / Video / Music / Code in Pro e Max |
| Open source | Sì (Apache 2.0) | No (SaaS ospitato) |
| Self-host | Sì | No |
| Prezzi | Free (self-hosted) · Letta Cloud (tier a pagamento) | Starter $14/mese · Pro $29/mese · Max $99/mese |
Letta self-hosted è gratuita se porta lo sforzo ingegneristico: un server, un database, deployment, monitoraggio, aggiornamenti. Letta Cloud è l'alternativa gestita con tier a pagamento basati sull'utilizzo. I prezzi di Alma sono fissi e adatti all'utente finale: Starter $14/mese (memorie illimitate, Haiku + Sonnet), Pro $29/mese (aggiunge Opus 4.7 con contesto da 1M token, ambienti illimitati e studi creativi), Max $99/mese (aggiunge REST API, server MCP, estensione VSCode, SDK e BYOK). La fatturazione annuale è «paghi 10 mesi, ne ottieni 12» su ogni piano a pagamento.
Costruire un agente autonomo a lunga esecuzione. Un team sta costruendo un agente AI che funziona in più passi senza intervento umano: agenti di ricerca, agenti ops, automazione multi-step. La memoria a livelli in stile OS in Letta (core / archival / recall) è progettata esattamente per questo: l'agente auto-gestisce ciò che resta nel contesto. Il modello a 3 livelli controllato dall'utente di Alma è conversazionale per default; può guidare un loop autonomo tramite l'SDK, ma la filosofia di curatela è opposta — prevedibile, esposta, modificata dall'utente invece che dall'agente.
L'utente finale vuole memoria attraverso gli strumenti che già usa. Letta è per team di ingegneria; non c'è prodotto per utente finale. Alma è il prodotto per utente finale. Si registri su alma.olivares.ai, colleghi il server MCP in cinque minuti e ogni client AI supportato (Claude Desktop, Cursor, Windsurf, Claude Code, VSCode) ha la stessa memoria. L'utente non pensa mai al paging della memoria archival o alle code di recall; Alma gestisce il recupero automaticamente.
Requisito open-source, self-host. Un team ha un requisito rigido che tutti i componenti girino dentro la propria infrastruttura con sorgente verificabile. Letta è la scelta giusta: Apache 2.0, sorgente completo, lo esegue dove vuole. Alma è un SaaS ospitato e non è lo strumento giusto quando il self-hosting è obbligatorio.
Scelga Letta se sta costruendo agenti AI autonomi — a lunga esecuzione, multi-step, agenti che prendono decisioni senza un umano — e l'astrazione di memoria a livelli in stile OS si mappa pulitamente sul Suo problema. Scelga Letta se l'open source è non negoziabile, se vuole ospitare autonomamente l'intero stack o se il Suo team di ingegneria ha la larghezza di banda per estendere e operare il framework. Il lignaggio di ricerca di Letta (il paper originale MemGPT) e la community attiva sono asset reali quando deve spingere il framework in direzioni personalizzate.
Scelga Alma se vuole usare AI con memoria invece di costruire infrastruttura per agenti autonomi. Si registri su alma.olivares.ai, inizi a chattare e la memoria funziona. Se lavora anche in Cursor, Claude Desktop, VSCode o Windsurf, installi il server MCP (gratuito) e la stessa memoria La segue. Scelga Alma se vuole un'identità AI strutturata e prevedibile (Soul Engine), se Le serve controllo completo di esportazione e modifica su ciò che l'AI sa, o se vuole studi creativi inclusi. Gli sviluppatori che vogliono un livello cognitivo completo nel proprio prodotto (memorie + episodi + procedure + Soul + assemblaggio del contesto valutato) ottengono SDK, server MCP e REST API sul piano Max.
La memoria a livelli di Letta e la memoria a 3 livelli di Alma sono la stessa cosa? No. I tier di Letta descrivono dove vivono i dati rispetto alla finestra di contesto (core / archival / recall). I livelli di Alma descrivono che tipo di conoscenza è (fatti / eventi / workflow). Assi diversi, modelli di curatela diversi.
Alma può funzionare come agente autonomo? Non nativamente nel senso di Letta: la chat di Alma è conversazionale, con l'utente che guida ogni turno. La memoria si accumula da quelle conversazioni. Se vuole un loop di agente completamente autonomo, lo costruisca sull'SDK / API di Alma; Alma Le dà il livello cognitivo, Lei costruisce il loop di agente.
Alma è open source? No. Alma è un SaaS ospitato. Letta è open source sotto Apache 2.0 ed è la scelta giusta se l'open source è un requisito rigido.
Posso migrare le mie memorie Letta in Alma? Non tramite un'importazione con un clic oggi. La differenza di forma (tier Letta vs livelli tipizzati Alma) significa che richiederebbe una conversione strutturata. La REST API su Max Le permette di scrivere l'importazione da solo se ha un archivio archival Letta e vuole portarlo.
Vedi i piani · Vedi i piani · Documentazione sviluppatori e SDK