Aktualisiert Mai 2026
Zep ist ein Langzeit-Memory-Backend für KI-Agenten. Sein Kern-Unterscheidungsmerkmal ist der temporale Wissensgraph: Während Konversationen einlaufen, extrahiert Zep automatisch Entitäten (Personen, Projekte, Produkte, Konzepte), verfolgt deren Attribute im Zeitverlauf und ermöglicht dem Agenten Abfragen wie „Was wussten wir über X am Datum Y" oder „Was hat sich an X zwischen damals und jetzt geändert". Die Graphiti-Graph-Engine treibt das an; das SDK und das gemanagte Cloud-Produkt umschließen es.
Zep ist für Engineering-Teams positioniert, die KI-Agenten im großen Maßstab bauen — typischerweise B2B-SaaS-Produkte, in denen die KI komplexe Multi-Turn-Interaktionen handhabt und das Team typisiertes Graph-Reasoning gegenüber flachem Vektor-Retrieval schätzt. Die Preisgestaltung ist überwiegend Enterprise / individuell; eine Open-Source-Community-Edition existiert für Self-Hosting.
Alma ist ein vollständiges persistentes Speicherprodukt. Endnutzer registrieren sich unter alma.olivares.ai, chatten mit Anthropic Claude (Haiku, Sonnet, Opus 4.7 mit 1M-tokens-Kontext), und die Speicherschicht erfasst automatisch Fakten, Präferenzen und Entscheidungen. Die Soul Engine kümmert sich um die KI-Identität. Image-, Video-, Music- und Code-Studios sind in Pro und Max gebündelt. Entwickler können auch den MCP-Server, das JavaScript SDK und die REST API im Max-Tarif nutzen.
Der Speicher ist in drei Schichten strukturiert (Memories, Episodes, Procedures) mit Fünf-Faktoren-Scoring. Kostenpflichtige Tarife starten bei $14/Monat (Starter) mit vollem Zugriff auf die Soul Engine.
Zeps temporaler Wissensgraph ist sein stärkstes Feature. Entitäten sind First-Class-Bürger; Sie können fragen „Was ist Projekt X?", „Wer arbeitet an Projekt X?", „Wann hat sich die Deadline geändert?", und Zep durchläuft den Graphen, um zu antworten. Das ist wirklich mächtig, wenn die KI über Beziehungen zwischen vielen Entitäten und deren Entwicklung über die Zeit reasoning muss — typisch für Kunden-Support-KI, Forschungsagenten und B2B-Workflow-Automatisierung.
Almas 3-Schichten-Modell ist meinungsstark bezüglich der Form: Memories (Fakten und Präferenzen), Episodes (Konversationszusammenfassungen) und Procedures (gelernte Workflows). Entitäts-Extraktion läuft heuristisch bei jeder Memory-Erstellung (keine zusätzlichen LLM-Kosten beim Lesen) und speist einen internen Wissensgraphen, aber das nutzerorientierte Modell sind die drei Schichten, nicht der Graph selbst. Retrieval ist hybrid (semantisch + Keyword) mit Fünf-Faktoren-Scoring. Der Trade-off: weniger explizites Graph-Reasoning, aber ein viel einfacheres Mentalmodell und ein funktionierender assemblierter Prompt in unter 100 ms, ohne eine Graph-Abfragesprache lernen zu müssen.
Zep ist Infrastruktur: Ein Engineering-Team integriert es in sein KI-Produkt. Die meisten Nutzer sehen Zeps Namen nie; sie sehen Ihr Produkt, das sich zufällig an sie erinnert. Alma ist ein Produkt: Endnutzer registrieren sich direkt, die Marke Alma ist das Erlebnis, und Entwickler sind eine zusätzliche Zielgruppe, die vom SDK und MCP-Server bedient wird.
Wenn Ihr Team einen KI-Agenten mit ausgeklügeltem Multi-Entity-Reasoning im Kern baut, wurde Zep genau dafür konzipiert. Wenn Sie (oder Ihr Team) KI mit Speicher über die Tools nutzen möchten, mit denen Sie bereits arbeiten — Cursor, Claude Desktop, VSCode — deckt Alma das ab, ohne dass Sie Integrationscode schreiben müssen.
| Feature | Zep | Alma |
|---|---|---|
| Ziel-Nutzer | Entwickler / Engineering-Teams, die KI-Agenten bauen | Endnutzer + Entwickler |
| Speicher-Modell | Temporaler Wissensgraph mit Entitäts-Extraktion (Graphiti) | 3-Schichten (Memories + Episodes + Procedures) mit internem Entitäts-Graph |
| Web-App / Chat | Nein — nur API und Admin-Dashboard | Ja — voller Chat mit Streaming, Tools, Dateianhängen |
| KI-Identität | Nicht bereitgestellt — eigene mitbringen | Soul Engine (13 versionierte Identitätsblöcke) |
| Zeitliches Bewusstsein | First-Class — Entitätsänderungen über die Zeit verfolgen | Episodes + Memory-Zeitstempel + Wichtigkeits-Abfall (keine Graph-Abfragesprache) |
| Kontext-Assemblierung | Eigene mitbringen — Graph-Abfragen liefern Daten, Sie bauen den Prompt | Eingebaut — assemblierter System-Prompt <100 ms, 5-Faktoren-Scoring |
| Integrationen | SDK, REST API, Framework-Adapter | MCP (Claude Desktop / Cursor / Windsurf), VSCode, JS SDK, REST API |
| Kreativtools | Keine | Image- / Video- / Music- / Code-Studios in Pro und Max |
| BYOK | N/A | Ja in Max — Anthropic, Replicate, Leonardo, ElevenLabs |
| Setup-Komplexität | Hoch — Graph-DB-Konzepte, Integrationsarbeit | Registrieren und chatten — keine Infrastruktur für Nutzer |
| Preisgestaltung | Open-Source-Community-Edition · Cloud / Enterprise (individuell) | Starter $14/Monat · Pro $29/Monat · Max $99/Monat |
Zeps Open-Source-Community-Edition läuft kostenlos, wenn Sie die Graph-Datenbank selbst hosten und den Integrationscode schreiben. Die gehosteten Cloud- und Enterprise-Stufen werden auf Anfrage angeboten und richten sich an Teams, die KI-Agenten im großen Maßstab ausliefern. Almas Preisgestaltung ist geradlinig und endnutzerfreundlich: Starter $14/Monat (unbegrenzte Erinnerungen, Haiku + Sonnet), Pro $29/Monat (ergänzt Opus 4.7 mit 1M-tokens-Kontext, unbegrenzte Environments und Kreativ-Studios), Max $99/Monat (ergänzt API, MCP-Server, VSCode-Erweiterung, SDK und BYOK). Jahresabrechnung ist „10 Monate bezahlen, 12 erhalten" in jedem kostenpflichtigen Tarif.
Endnutzer-Speicher über Tools hinweg. Ein Nutzer möchte KI mit Speicher über Claude Desktop, Cursor, VSCode und das Web hinweg. Zep hat kein Endnutzer-Produkt — es ist Infrastruktur, die in das Produkt eines anderen eingebettet wird. Alma ist das Endnutzer-Produkt selbst: registrieren, MCP-Server verbinden, und jeder unterstützte Client hat in fünf Minuten Speicher.
B2B-Kunden-Support-Agent mit zeitlichem Reasoning. Ein Engineering-Team baut einen KI-Agenten, der Support-Tickets bearbeitet und über „Was wussten wir über Konto X am Datum Y" oder „Wann haben sich die Vertragsbedingungen geändert" reasoning muss. Zeps temporaler Wissensgraph (Graphiti) ist genau dafür gemacht — Entitäten sind First-Class-Bürger, Attribute werden über die Zeit verfolgt, Graph-Abfragen beantworten zeitliche Fragen natürlich. Almas typisiertes 3-Schichten-Modell kann „Was wissen wir über X" per Suche beantworten, stellt aber keine expliziten temporalen Graph-Abfragen bereit — das ist Zeps differenzierte Stärke.
Solo-Entwickler, der Speicher für sein eigenes KI-Nebenprojekt möchte. Ein Entwickler baut ein kleines KI-Tool und möchte persistenten Speicher, ohne eine Graph-Datenbank aufzusetzen, Migrationen auszuführen und Graph-Abfragecode zu schreiben. Almas SDK in Max ($99/Monat) bietet eine vollständige kognitive Schicht (Speicher + Soul + Kontext-Assemblierung) mit einer HTTP-API. Zeps selbst gehostete Community-Edition ist für diesen Fall ebenfalls kostenlos, erwartet aber Engineering-Investition, bevor das erste Feature ausgeliefert wird.
Wählen Sie Zep, wenn Sie ein Engineering-Team sind, das ein KI-Agenten-Produkt baut, in dem zeitliches Entitäts-Reasoning Kern des Erlebnisses ist — eine Kunden-Support-KI, die Konten verfolgt, ein Forschungsagent, der Hypothesen über Wochen verfolgt, eine Enterprise-Workflow-Automatisierung, die genau wissen muss, wann sich eine Tatsache geändert hat und warum. Das Graph-Modell zahlt sich aus, wenn „Zeige mir den Zustand von Entität X am Datum Y" eine echte Abfrage ist, die Sie beantworten müssen. Sie werden Integrationscode und wahrscheinlich eine Wrapper-UI schreiben; das ist der Deal.
Wählen Sie Alma, wenn Sie KI-Speicher nutzen möchten, statt Infrastruktur zu bauen. Registrieren, mit dem Chatten beginnen, und der Speicher funktioniert. Wenn Sie auch in Cursor / Claude Desktop / VSCode / Windsurf arbeiten, installieren Sie den MCP-Server (kostenlos), und derselbe Speicher folgt Ihnen. Wählen Sie Alma, wenn Sie eine strukturierte KI-Identität (Soul Engine), gebündelte Kreativ-Studios oder ein erschwingliches Single-User-Abonnement möchten. Entwickler, die Alma in ihre eigenen Apps einbetten möchten, erhalten das SDK, den MCP-Server und die REST API im Max-Tarif ($99/Monat) — eine vollständige kognitive Schicht statt nur eines Memory-Backends.
Hat Alma zeitliches Bewusstsein? Ja, aber mit einem anderen Modell. Memories tragen Erstellungs- und Letzte-Zugriffs-Zeitstempel; Episodes sind zeitlich geordnete Konversationszusammenfassungen; der Wichtigkeits-Abfall (5-Faktoren-Scoring enthält Aktualität 10 %) lässt ältere Erinnerungen natürlich verblassen. Es gibt keine Graph-Abfragesprache für „Zustand zum Zeitpunkt T" — das ist Zeps differenziertes Feature, nicht Almas.
Hat Alma einen Entitäts-Wissensgraphen? Ja, intern. Entitäts-Extraktion läuft heuristisch bei jeder Memory-Erstellung (keine zusätzlichen LLM-Kosten beim Lesen) und speist den Graphen, der beim Retrieval verwendet wird. Er ist heute nicht als Graph nutzer-abfragbar; das nutzerorientierte Modell bleibt „Memories / Episodes / Procedures".
Kann Alma Zep in meinem KI-Agenten-Produkt ersetzen? Manchmal. Wenn Ihr Agent endnutzerorientiert ist und die Speicher-Bedürfnisse „sich an Präferenzen, Entscheidungen und Kontext über Sitzungen hinweg erinnern" sind, geben Ihnen Almas SDK + REST API in Max, was Sie brauchen, ohne einen Wrapper zu bauen. Wenn Sie explizite temporale Graph-Abfragen benötigen, ist Zep das richtige Werkzeug.
Ist Alma Open Source? Nein. Alma ist ein gehostetes SaaS. Zep liefert eine Open-Source-Community-Edition, die Sie selbst hosten können.
Zep ist zweckmäßig für Engineering-Teams, die KI-Agenten ausliefern, die explizites temporales Graph-Reasoning brauchen. Alma ist das richtige Werkzeug, wenn Sie ein vollständiges Speicher-Produkt (Chat, Soul Engine, MCP, Kreativ-Studios) ohne Infrastruktur-Arbeit möchten oder wenn Sie eine kognitive Schicht für Ihre eigene App brauchen, ohne das typisierte Memory-Modell und die Soul Engine selbst zu schreiben. Der Starter-Tarif ($14/Monat) zeigt Ihnen das Produkt end-to-end in fünf Minuten.
Tarife ansehen · Tarife ansehen · Entwicklerdokumentation und SDK