Aggiornato a maggio 2026
Zep è un backend di memoria a lungo termine per agenti AI. Il suo differenziatore principale è il knowledge graph temporale: mentre le conversazioni fluiscono, Zep estrae automaticamente entità (persone, progetti, prodotti, concetti), traccia i loro attributi nel tempo e permette all'agente di interrogare «cosa sapevamo su X alla data Y» o «cosa è cambiato su X tra allora e ora». Il motore graph Graphiti alimenta questo; l'SDK e il prodotto cloud gestito lo avvolgono.
Zep è posizionato per team di ingegneria che costruiscono agenti AI su larga scala — tipicamente prodotti SaaS B2B dove l'AI gestisce interazioni complesse multi-turno e il team valorizza il ragionamento graph tipizzato rispetto al recupero vettoriale piatto. I prezzi sono prevalentemente enterprise / custom; esiste una community edition open-source per il self-hosting.
Alma è un prodotto completo di memoria persistente. Gli utenti finali si registrano su alma.olivares.ai, chattano con Anthropic Claude (Haiku, Sonnet, Opus 4.7 con contesto da 1M token) e il livello di memoria cattura automaticamente fatti, preferenze e decisioni. Il Soul Engine gestisce l'identità AI. Studi Image, Video, Music e Code sono inclusi in Pro e Max. Gli sviluppatori possono usare anche il server MCP, il JavaScript SDK e la REST API sul piano Max.
La memoria è strutturata in tre livelli (memorie, episodi, procedure) con scoring a cinque fattori. I piani a pagamento partono da $14/mese (Starter) con accesso completo al Soul Engine.
Il knowledge graph temporale di Zep è la sua funzione più forte. Le entità sono cittadini di prima classe; può chiedere «cos'è il progetto X?», «chi lavora sul progetto X?», «quando è cambiata la scadenza?» e Zep attraversa il graph per rispondere. Questo è genuinamente potente quando l'AI deve ragionare sulle relazioni tra molte entità e su come evolvono nel tempo: tipico dell'AI di assistenza clienti, degli agenti di ricerca e dell'automazione di workflow B2B.
Il modello a 3 livelli di Alma è opinionato sulla forma: memorie (fatti e preferenze), episodi (riassunti di conversazione) e procedure (workflow appresi). L'estrazione di entità viene eseguita euristicamente a ogni creazione di memoria (nessun costo LLM extra in lettura) e alimenta un knowledge graph interno, ma il modello rivolto all'utente sono i tre livelli, non il graph stesso. Il recupero è ibrido (semantico + parole chiave) con scoring a cinque fattori. Il trade-off: meno ragionamento graph esplicito, ma un modello mentale molto più semplice e un prompt assemblato funzionante in meno di 100ms senza un linguaggio di query graph da imparare.
Zep è infrastruttura: un team di ingegneria lo integra nel proprio prodotto AI. La maggior parte degli utenti non vede mai il nome di Zep; vede il Suo prodotto, che casualmente li ricorda. Alma è un prodotto: gli utenti finali si registrano direttamente, il marchio Alma è l'esperienza e gli sviluppatori sono un pubblico aggiuntivo servito dall'SDK e dal server MCP.
Se il Suo team sta costruendo un agente AI con ragionamento sofisticato multi-entità al suo centro, Zep è stato progettato esattamente per questo. Se Lei (o il Suo team) vuole usare l'AI con memoria attraverso gli strumenti in cui già lavora — Cursor, Claude Desktop, VSCode — Alma copre questo senza scrivere codice di integrazione.
| Funzione | Zep | Alma |
|---|---|---|
| Utente target | Sviluppatori / team di ingegneria che costruiscono agenti AI | Utenti finali + sviluppatori |
| Modello di memoria | Knowledge graph temporale con estrazione di entità (Graphiti) | 3 livelli (memorie + episodi + procedure) con graph di entità interno |
| Web app / chat | No — solo API e dashboard admin | Sì — chat completa con streaming, strumenti, allegati file |
| Identità AI | Non fornita — la porta Lei | Soul Engine (13 blocchi di identità versionati) |
| Consapevolezza temporale | Di prima classe — traccia i cambiamenti delle entità nel tempo | Episodi + timestamp di memoria + decadimento dell'importanza (nessun linguaggio di query graph) |
| Assemblaggio del contesto | Lo porta Lei — le query graph restituiscono dati, costruisce Lei il prompt | Integrato — system prompt assemblato <100ms, scoring a 5 fattori |
| Integrazioni | SDK, REST API, adattatori framework | MCP (Claude Desktop / Cursor / Windsurf), VSCode, JS SDK, REST API |
| Strumenti creativi | Nessuno | Studi Image / Video / Music / Code in Pro e Max |
| BYOK | N/D | Sì su Max — Anthropic, Replicate, Leonardo, ElevenLabs |
| Complessità di setup | Alta — concetti DB graph, lavoro di integrazione | Si registri e chatti — zero infrastruttura per gli utenti |
| Prezzi | Community edition open-source · cloud / enterprise (custom) | Starter $14/mese · Pro $29/mese · Max $99/mese |
La community edition open-source di Zep è gratuita se ospita autonomamente il database graph e scrive il codice di integrazione. I tier cloud ospitato ed enterprise sono quotati su richiesta e mirati a team che distribuiscono agenti AI su larga scala. I prezzi di Alma sono semplici e adatti all'utente finale: Starter $14/mese (memorie illimitate, Haiku + Sonnet), Pro $29/mese (aggiunge Opus 4.7 con contesto da 1M token, ambienti illimitati e studi creativi), Max $99/mese (aggiunge API, server MCP, estensione VSCode, SDK e BYOK). La fatturazione annuale è «paghi 10 mesi, ne ottieni 12» su ogni piano a pagamento.
Memoria da utente finale tra gli strumenti. Un utente vuole AI con memoria attraverso Claude Desktop, Cursor, VSCode e il web. Zep non ha un prodotto per utente finale: è infrastruttura da integrare nel prodotto di qualcun altro. Alma è il prodotto per utente finale stesso: si registri, colleghi il server MCP e ogni client supportato ha memoria in cinque minuti.
Agente di assistenza clienti B2B con ragionamento temporale. Un team di ingegneria sta costruendo un agente AI che gestisce ticket di supporto e deve ragionare su «cosa sapevamo sull'account X alla data Y» o «quando sono cambiati i termini contrattuali». Il knowledge graph temporale di Zep (Graphiti) è progettato per questo: le entità sono cittadini di prima classe, gli attributi sono tracciati nel tempo, le query graph rispondono naturalmente alle domande temporali. Il modello tipizzato a 3 livelli di Alma può rispondere a «cosa sappiamo su X» tramite ricerca, ma non espone query graph temporali esplicite — quella è la forza differenziata di Zep.
Sviluppatore singolo che vuole memoria nel proprio side project AI. Uno sviluppatore sta costruendo un piccolo strumento AI e vuole memoria persistente senza tirar su un database graph, eseguire migrazioni e scrivere codice di query graph. L'SDK di Alma su Max ($99/mese) fornisce un livello cognitivo completo (memoria + Soul + assemblaggio del contesto) con un'API HTTP. Anche la community edition self-hosted di Zep è gratuita per questo caso ma aspetta investimento ingegneristico prima che la prima funzione venga distribuita.
Scelga Zep se è un team di ingegneria che costruisce un prodotto agente AI in cui il ragionamento temporale di entità è al centro dell'esperienza: un'AI di assistenza clienti che traccia account, un agente di ricerca che segue ipotesi nel corso di settimane, un'automazione di workflow enterprise che deve sapere esattamente quando un fatto è cambiato e perché. Il modello graph si ripaga quando «mostrami lo stato dell'entità X alla data Y» è una query reale a cui deve rispondere. Scriverà codice di integrazione e probabilmente un'UI wrapper; questo è il patto.
Scelga Alma se vuole usare la memoria AI invece di costruire infrastruttura. Si registri, inizi a chattare e la memoria funziona. Se lavora anche in Cursor / Claude Desktop / VSCode / Windsurf, installi il server MCP (gratuito) e la stessa memoria La segue. Scelga Alma se vuole un'identità AI strutturata (Soul Engine), studi creativi inclusi o un abbonamento singolo utente accessibile. Gli sviluppatori che vogliono incorporare Alma nelle proprie app ottengono SDK, server MCP e REST API sul piano Max ($99/mese): un livello cognitivo completo invece di solo un backend di memoria.
Alma ha consapevolezza temporale? Sì, ma con un modello diverso. Le memorie portano timestamp di creazione e ultimo accesso; gli episodi sono riassunti di conversazione ordinati nel tempo; il decadimento dell'importanza (lo scoring a 5 fattori include attualità al 10%) permette alle memorie più vecchie di svanire naturalmente. Non c'è un linguaggio di query graph per «stato al tempo T»: quella è la funzione differenziata di Zep, non di Alma.
Alma ha un knowledge graph di entità? Sì, internamente. L'estrazione di entità viene eseguita euristicamente a ogni creazione di memoria (nessun costo LLM extra in lettura) e alimenta il graph utilizzato al momento del recupero. Non è interrogabile dall'utente come un graph oggi; il modello rivolto all'utente rimane «memorie / episodi / procedure».
Alma può sostituire Zep nel mio prodotto agente AI? A volte. Se il Suo agente è rivolto all'utente finale e le esigenze di memoria sono «ricordare preferenze, decisioni e contesto tra le sessioni», SDK + REST API di Alma su Max Le danno ciò che Le serve senza costruire un wrapper. Se Le servono query graph temporali esplicite, Zep è lo strumento giusto.
Alma è open source? No. Alma è un SaaS ospitato. Zep distribuisce una community edition open-source che può ospitare autonomamente.
Zep è progettato per team di ingegneria che distribuiscono agenti AI che necessitano di ragionamento graph temporale esplicito. Alma è lo strumento giusto quando vuole un prodotto di memoria completo (chat, Soul Engine, MCP, studi creativi) senza lavoro infrastrutturale, o quando Le serve un livello cognitivo per la propria app senza scrivere il modello di memoria tipizzato e il Soul Engine da soli. Il piano Starter ($14/mese) Le mostra il prodotto end-to-end in cinque minuti.
Vedi i piani · Vedi i piani · Documentazione sviluppatori e SDK