Alma vs Letta (MemGPT)

Bijgewerkt mei 2026

Letta (voorheen MemGPT) is een open-source framework voor het bouwen van stateful AI-agents. Zijn tiered geheugen (core / archival / recall) is geïnspireerd op virtueel geheugen van een besturingssysteem: de agent zelf beslist wat te onthouden en te vergeten. Alma is een productie-SaaS waar de gebruiker het geheugen beheert: 3-laagse getypte architectuur (memories / episodes / procedures), Soul Engine-identiteit, volledige UI, MCP-server, creatieve studio's.

Wat is Letta (MemGPT)?

Letta is de productie-grade evolutie van MemGPT, het onderzoekspaper uit 2023 dat voorstelde het contextvenster van een LLM te behandelen als de OS-analogie van RAM en „geheugen-paging" te gebruiken om minder-relevante feiten in en uit te wisselen. Het framework wordt geleverd open-source onder Apache 2.0 en is ontworpen voor engineering-teams die autonome AI-agents bouwen — agents die over meerdere stappen handelen zonder een mens in de loop, die staat behouden over sessies en die over hun eigen geheugen moeten kunnen redeneren.

Letta's tiered geheugen heeft drie lagen: core memory (altijd in context, bewerkt door de agent zelf via tool-aanroepen), archival memory (vector-doorzoekbaar, door agent doorzocht) en recall memory (volledige gespreksgeschiedenis). De definiërende eigenschap is zelfbeheer: de agent beslist wat wordt gepromoot naar core, wat wordt gearchiveerd, wat wordt vergeten. Er is ook Letta Cloud (betaalde gehoste tier) en een developer-gerichte web-UI voor het bouwen en testen van agents.

Wat is Alma?

Alma is een compleet permanent geheugenproduct voor eindgebruikers en ontwikkelaars. Eindgebruikers registreren zich op alma.olivares.ai, chatten met Anthropic Claude (Haiku, Sonnet, Opus 4.7 met 1M-token context) en de geheugenlaag legt feiten, voorkeuren en beslissingen automatisch vast. Soul Engine handelt identiteit af. Image, Video, Music en Code-studio's zijn gebundeld. Ontwikkelaars kunnen hetzelfde geheugen ook bereiken via de MCP-server, de JavaScript SDK en de REST API op het Max-abonnement.

Geheugen is gestructureerd in drie lagen (memories / episodes / procedures), elk getypt, elk anders opgehaald. Betaalde abonnementen beginnen bij $14/maand (Starter) met de volledige Soul Engine met onbeperkte herinneringen.

Hoe verschillen ze in geheugenarchitectuur?

Beide hebben drie lagen, maar de filosofie is tegengesteld. De tiers van Letta gaan over waar de data leeft ten opzichte van het contextvenster — core (altijd in), archival (één tool-aanroep verderop), recall (alle geschiedenis). De agent beweegt data tussen tiers met ingebouwde tools.

De lagen van Alma gaan over wat voor kennis het is — memories (feiten), episodes (gebeurtenissen), procedures (workflows). Elke laag heeft zijn eigen retrieval- en levenscyclusregels. De gebruiker kan alles in elke laag lezen, bewerken, scoren en verwijderen. Contextsamenstelling stelt ze samen tot de systeemprompt voor elke chat — de gebruiker hoeft er niet over na te denken, maar kan alles inspecteren.

De controle-as is het belangrijkst. Letta is agent-beheerd: de LLM zelf is de curator. Dit is krachtig voor autonome agents maar moeilijker te voorspellen — uw agent zou kunnen besluiten dat uw stackvoorkeur onbelangrijk is en het archiveren. Alma is door de gebruiker beheerd: belangrijkheid, vertrouwen, categorie en volledige CRUD liggen in handen van de gebruiker. Voorspelbaar, debugbaar, exporteerbaar.

Hoe verschillen ze in doelgebruiker?

Letta is voor engineering-teams die autonome AI-agents bouwen — producten waar de AI draait zonder een mens in de loop, beslissingen neemt en het OS-stijl geheugenmodel nodig heeft om coherent te blijven over lange horizons. Het framework is open source dus u kunt elke regel lezen, forken en zelf hosten.

Alma is voor eindgebruikers die AI met geheugen willen over de tools die ze al gebruiken — Cursor, Claude Desktop, VSCode, Windsurf, de Alma web-app — en voor ontwikkelaars die een complete cognitieve laag willen om in hun eigen producten te embedden zonder er een vanaf nul te schrijven. De afweging is closed-source SaaS, maar met de snelheid en stabiliteit die daarmee samenhangen.

Feature-voor-feature vergelijking

FeatureLetta (MemGPT)Alma
DoelgebruikerOntwikkelaars die autonome AI-agents bouwenEindgebruikers + ontwikkelaars
GeheugenmodelTiered op locatie: core + archival + recall (agent-beheerd)Getypt op vorm: memories + episodes + procedures (door gebruiker beheerd)
GeheugencuratieAgent beslist via tool-aanroepen — voorspelbaarheid varieert per modelGebruiker beheert: volledige CRUD, categorieën, belangrijkheid, scoring, zoeken
Eindgebruiker-productNee — developer SDK / framework + Letta Cloud-dashboardJa — volledige web-app met chat, streaming, tools, bestandsbijlagen
AI-identiteitAgent-persona via systeemprompt + core memorySoul Engine — 13 geversioneerde identiteitsblokken in XML-secties
Cross-tool bereikWat u erbovenop bouwt — geen MCP / VSCode kant-en-klaarMCP (Claude Desktop / Cursor / Windsurf), VSCode, SDK, REST API
Creatieve toolsGeenImage / Video / Music / Code-studio's in Pro en Max
Open sourceJa (Apache 2.0)Nee (gehoste SaaS)
Self-hostJaNee
PrijzenGratis (zelf-gehost) · Letta Cloud (betaalde tiers)Starter $14/maand · Pro $29/maand · Max $99/maand

Prijsvergelijking

Letta zelf-gehost is gratis als u de engineering-inspanning levert: een server, een database, deployment, monitoring, updates. Letta Cloud is het beheerde alternatief met betaalde tiers op basis van gebruik. De prijsstelling van Alma is vast en eindgebruiker-vriendelijk: Starter $14/maand (onbeperkte herinneringen, Haiku + Sonnet), Pro $29/maand (voegt Opus 4.7 met 1M-token context, onbeperkte omgevingen en creatieve studio's toe), Max $99/maand (voegt REST API, MCP-server, VSCode-extensie, SDK en BYOK toe). Jaarlijkse facturering is „betaal 10 maanden, krijg 12" op elk betaald abonnement.

Veelvoorkomende workflows in de praktijk

Een langlopende autonome agent bouwen. Een team bouwt een AI-agent die over meerdere stappen draait zonder menselijke interventie — onderzoeksagents, ops-agents, multi-step automatisering. Het OS-stijl tiered geheugen in Letta (core / archival / recall) is hier precies voor ontworpen: de agent beheert zelf wat in context blijft. Alma's door de gebruiker beheerde 3-laags model is standaard conversationeel; het kan een autonome lus aandrijven via de SDK, maar de curatiefilosofie is tegengesteld — voorspelbaar, blootgesteld, bewerkt door de gebruiker in plaats van door de agent.

Eindgebruiker wil geheugen over de tools die hij al gebruikt. Letta is voor engineering-teams; er is geen eindgebruiker-product. Alma is het eindgebruiker-product. Registreer op alma.olivares.ai, verbind de MCP-server in vijf minuten en elke ondersteunde AI-client (Claude Desktop, Cursor, Windsurf, Claude Code, VSCode) heeft hetzelfde geheugen. De gebruiker denkt nooit over archival memory paging of recall queues; Alma handelt retrieval automatisch af.

Open-source, self-host vereiste. Een team heeft een harde vereiste dat alle componenten in hun eigen infrastructuur draaien met controleerbare broncode. Letta is de juiste keuze — Apache 2.0, volledige bron, draai het waar u wilt. Alma is een gehoste SaaS en is niet de juiste tool wanneer self-hosting verplicht is.

Wanneer moet ik voor Letta kiezen?

Kies Letta als u autonome AI-agents bouwt — langlopende, multi-step, agents-die-beslissingen-maken-zonder-een-mens — en de OS-stijl tiered geheugen-abstractie schoon op uw probleem mapt. Kies Letta als open source niet onderhandelbaar is, als u de hele stack zelf wilt hosten, of als uw engineering-team bandbreedte heeft om het framework uit te breiden en te beheren. De onderzoeksafkomst van Letta (het oorspronkelijke MemGPT-paper) en de actieve community zijn echte voordelen wanneer u het framework in aangepaste richtingen moet duwen.

Wanneer moet ik voor Alma kiezen?

Kies Alma als u AI met geheugen wilt gebruiken in plaats van infrastructuur voor autonome agents te bouwen. Registreer op alma.olivares.ai, begin met chatten en geheugen werkt. Als u ook in Cursor, Claude Desktop, VSCode of Windsurf werkt, installeer de MCP-server (gratis) en hetzelfde geheugen volgt u. Kies Alma als u een gestructureerde, voorspelbare AI-identiteit wilt (Soul Engine), als u volledige export- en bewerkcontrole nodig hebt over wat de AI weet, of als u gebundelde creatieve studio's wilt. Ontwikkelaars die een complete cognitieve laag in hun eigen product willen (memories + episodes + procedures + Soul + gescoorde contextsamenstelling) krijgen de SDK, MCP-server en REST API op het Max-abonnement.

Veelgestelde vragen

Zijn Letta's tiered geheugen en Alma's 3-laags geheugen hetzelfde? Nee. Letta's tiers beschrijven waar de data leeft ten opzichte van het contextvenster (core / archival / recall). Alma's lagen beschrijven welk soort kennis het is (feiten / gebeurtenissen / workflows). Verschillende assen, verschillende curatiemodellen.

Kan Alma als autonome agent draaien? Niet native in de Letta-zin — de chat van Alma is conversationeel, met de gebruiker die elke beurt aandrijft. Geheugen accumuleert uit die gesprekken. Als u een volledig autonome agent-lus wilt, bouw deze op de Alma SDK / API; Alma geeft u de cognitieve laag, u bouwt de agent-lus.

Is Alma open source? Nee. Alma is een gehoste SaaS. Letta is open source onder Apache 2.0 en is de juiste keuze als open source een harde vereiste is.

Kan ik mijn Letta-herinneringen naar Alma migreren? Niet via een one-click import vandaag. Het vormverschil (Letta-tiers vs Alma-getypte lagen) betekent dat het een gestructureerde conversie nodig heeft. De REST API op Max laat u de import zelf schrijven als u een Letta archival store heeft en deze wilt overzetten.

Bekijk abonnementen · Bekijk abonnementen · Developer documentatie en SDK

See plans