Alma vs Zep

Q: Alma ha consapevolezza temporale?

Sì: le memorie portano timestamp, gli episodi sono riassunti di conversazione ordinati nel tempo e il decadimento dell'importanza permette alle memorie più vecchie di svanire naturalmente. Non c'è un linguaggio di query graph per stato-al-tempo-T; quella è la funzione specifica di Zep.

Q: Alma ha un knowledge graph di entità?

Sì, internamente. L'estrazione di entità viene eseguita euristicamente a ogni creazione di memoria (nessun costo LLM extra in lettura) e alimenta il graph utilizzato al momento del recupero. Non è interrogabile dall'utente come un graph oggi.

Q: Alma può sostituire Zep nel mio prodotto agente AI?

A volte. Se il Suo agente è rivolto all'utente finale e le esigenze di memoria sono ricordare preferenze e decisioni tra sessioni, SDK + REST API di Alma su Max funzionano. Se Le servono query graph temporali esplicite, Zep è lo strumento giusto.

Q: Alma è open source?

No. Alma è un SaaS ospitato. Zep distribuisce una community edition open-source che può ospitare autonomamente.

Aggiornato a maggio 2026

Zep è un prodotto infrastrutturale per sviluppatori: un knowledge graph temporale che estrae automaticamente entità dalle conversazioni e traccia come i fatti cambiano nel tempo. Lo integra nella Sua app AI tramite API o SDK. Alma è un prodotto completo: web app, chat con Claude, identità Soul Engine, server MCP, estensione VSCode e studi creativi, pronto all'uso senza scrivere codice infrastrutturale.

Cos'è Zep?

Zep è un backend di memoria a lungo termine per agenti AI. Il suo differenziatore principale è il knowledge graph temporale: mentre le conversazioni fluiscono, Zep estrae automaticamente entità (persone, progetti, prodotti, concetti), traccia i loro attributi nel tempo e permette all'agente di interrogare «cosa sapevamo su X alla data Y» o «cosa è cambiato su X tra allora e ora». Il motore graph Graphiti alimenta questo; l'SDK e il prodotto cloud gestito lo avvolgono.

Zep è posizionato per team di ingegneria che costruiscono agenti AI su larga scala — tipicamente prodotti SaaS B2B dove l'AI gestisce interazioni complesse multi-turno e il team valorizza il ragionamento graph tipizzato rispetto al recupero vettoriale piatto. I prezzi sono prevalentemente enterprise / custom; esiste una community edition open-source per il self-hosting.

Cos'è Alma?

Alma è un prodotto completo di memoria persistente. Gli utenti finali si registrano su alma.olivares.ai, chattano con Anthropic Claude (Haiku, Sonnet, Opus 4.7 con contesto da 1M token) e il livello di memoria cattura automaticamente fatti, preferenze e decisioni. Il Soul Engine gestisce l'identità AI. Studi Image, Video, Music e Code sono inclusi in Pro e Max. Gli sviluppatori possono usare anche il server MCP, il JavaScript SDK e la REST API sul piano Max.

La memoria è strutturata in tre livelli (memorie, episodi, procedure) con scoring a cinque fattori. I piani a pagamento partono da $14/mese (Starter) con accesso completo al Soul Engine.

In cosa differiscono sull'architettura di memoria?

Il knowledge graph temporale di Zep è la sua funzione più forte. Le entità sono cittadini di prima classe; può chiedere «cos'è il progetto X?», «chi lavora sul progetto X?», «quando è cambiata la scadenza?» e Zep attraversa il graph per rispondere. Questo è genuinamente potente quando l'AI deve ragionare sulle relazioni tra molte entità e su come evolvono nel tempo: tipico dell'AI di assistenza clienti, degli agenti di ricerca e dell'automazione di workflow B2B.

Il modello a 3 livelli di Alma è opinionato sulla forma: memorie (fatti e preferenze), episodi (riassunti di conversazione) e procedure (workflow appresi). L'estrazione di entità viene eseguita euristicamente a ogni creazione di memoria (nessun costo LLM extra in lettura) e alimenta un knowledge graph interno, ma il modello rivolto all'utente sono i tre livelli, non il graph stesso. Il recupero è ibrido (semantico + parole chiave) con scoring a cinque fattori. Il trade-off: meno ragionamento graph esplicito, ma un modello mentale molto più semplice e un prompt assemblato funzionante in meno di 100ms senza un linguaggio di query graph da imparare.

In cosa differiscono per utente target?

Zep è infrastruttura: un team di ingegneria lo integra nel proprio prodotto AI. La maggior parte degli utenti non vede mai il nome di Zep; vede il Suo prodotto, che casualmente li ricorda. Alma è un prodotto: gli utenti finali si registrano direttamente, il marchio Alma è l'esperienza e gli sviluppatori sono un pubblico aggiuntivo servito dall'SDK e dal server MCP.

Se il Suo team sta costruendo un agente AI con ragionamento sofisticato multi-entità al suo centro, Zep è stato progettato esattamente per questo. Se Lei (o il Suo team) vuole usare l'AI con memoria attraverso gli strumenti in cui già lavora — Cursor, Claude Desktop, VSCode — Alma copre questo senza scrivere codice di integrazione.

Confronto funzione per funzione

Funzione	Zep	Alma
Utente target	Sviluppatori / team di ingegneria che costruiscono agenti AI	Utenti finali + sviluppatori
Modello di memoria	Knowledge graph temporale con estrazione di entità (Graphiti)	3 livelli (memorie + episodi + procedure) con graph di entità interno
Web app / chat	No — solo API e dashboard admin	Sì — chat completa con streaming, strumenti, allegati file
Identità AI	Non fornita — la porta Lei	Soul Engine (13 blocchi di identità versionati)
Consapevolezza temporale	Di prima classe — traccia i cambiamenti delle entità nel tempo	Episodi + timestamp di memoria + decadimento dell'importanza (nessun linguaggio di query graph)
Assemblaggio del contesto	Lo porta Lei — le query graph restituiscono dati, costruisce Lei il prompt	Integrato — system prompt assemblato <100ms, scoring a 5 fattori
Integrazioni	SDK, REST API, adattatori framework	MCP (Claude Desktop / Cursor / Windsurf), VSCode, JS SDK, REST API
Strumenti creativi	Nessuno	Studi Image / Video / Music / Code in Pro e Max
BYOK	N/D	Sì su Max — Anthropic, Replicate, Leonardo, ElevenLabs
Complessità di setup	Alta — concetti DB graph, lavoro di integrazione	Si registri e chatti — zero infrastruttura per gli utenti
Prezzi	Community edition open-source · cloud / enterprise (custom)	Starter $14/mese · Pro $29/mese · Max $99/mese

Confronto dei prezzi

La community edition open-source di Zep è gratuita se ospita autonomamente il database graph e scrive il codice di integrazione. I tier cloud ospitato ed enterprise sono quotati su richiesta e mirati a team che distribuiscono agenti AI su larga scala. I prezzi di Alma sono semplici e adatti all'utente finale: Starter $14/mese (memorie illimitate, Haiku + Sonnet), Pro $29/mese (aggiunge Opus 4.7 con contesto da 1M token, ambienti illimitati e studi creativi), Max $99/mese (aggiunge API, server MCP, estensione VSCode, SDK e BYOK). La fatturazione annuale è «paghi 10 mesi, ne ottieni 12» su ogni piano a pagamento.

Flussi di lavoro comuni nella pratica

Memoria da utente finale tra gli strumenti. Un utente vuole AI con memoria attraverso Claude Desktop, Cursor, VSCode e il web. Zep non ha un prodotto per utente finale: è infrastruttura da integrare nel prodotto di qualcun altro. Alma è il prodotto per utente finale stesso: si registri, colleghi il server MCP e ogni client supportato ha memoria in cinque minuti.

Agente di assistenza clienti B2B con ragionamento temporale. Un team di ingegneria sta costruendo un agente AI che gestisce ticket di supporto e deve ragionare su «cosa sapevamo sull'account X alla data Y» o «quando sono cambiati i termini contrattuali». Il knowledge graph temporale di Zep (Graphiti) è progettato per questo: le entità sono cittadini di prima classe, gli attributi sono tracciati nel tempo, le query graph rispondono naturalmente alle domande temporali. Il modello tipizzato a 3 livelli di Alma può rispondere a «cosa sappiamo su X» tramite ricerca, ma non espone query graph temporali esplicite — quella è la forza differenziata di Zep.

Sviluppatore singolo che vuole memoria nel proprio side project AI. Uno sviluppatore sta costruendo un piccolo strumento AI e vuole memoria persistente senza tirar su un database graph, eseguire migrazioni e scrivere codice di query graph. L'SDK di Alma su Max ($99/mese) fornisce un livello cognitivo completo (memoria + Soul + assemblaggio del contesto) con un'API HTTP. Anche la community edition self-hosted di Zep è gratuita per questo caso ma aspetta investimento ingegneristico prima che la prima funzione venga distribuita.

Quando dovrei scegliere Zep?

Scelga Zep se è un team di ingegneria che costruisce un prodotto agente AI in cui il ragionamento temporale di entità è al centro dell'esperienza: un'AI di assistenza clienti che traccia account, un agente di ricerca che segue ipotesi nel corso di settimane, un'automazione di workflow enterprise che deve sapere esattamente quando un fatto è cambiato e perché. Il modello graph si ripaga quando «mostrami lo stato dell'entità X alla data Y» è una query reale a cui deve rispondere. Scriverà codice di integrazione e probabilmente un'UI wrapper; questo è il patto.

Quando dovrei scegliere Alma?

Scelga Alma se vuole usare la memoria AI invece di costruire infrastruttura. Si registri, inizi a chattare e la memoria funziona. Se lavora anche in Cursor / Claude Desktop / VSCode / Windsurf, installi il server MCP (gratuito) e la stessa memoria La segue. Scelga Alma se vuole un'identità AI strutturata (Soul Engine), studi creativi inclusi o un abbonamento singolo utente accessibile. Gli sviluppatori che vogliono incorporare Alma nelle proprie app ottengono SDK, server MCP e REST API sul piano Max ($99/mese): un livello cognitivo completo invece di solo un backend di memoria.

Domande frequenti

Alma ha consapevolezza temporale? Sì, ma con un modello diverso. Le memorie portano timestamp di creazione e ultimo accesso; gli episodi sono riassunti di conversazione ordinati nel tempo; il decadimento dell'importanza (lo scoring a 5 fattori include attualità al 10%) permette alle memorie più vecchie di svanire naturalmente. Non c'è un linguaggio di query graph per «stato al tempo T»: quella è la funzione differenziata di Zep, non di Alma.

Alma ha un knowledge graph di entità? Sì, internamente. L'estrazione di entità viene eseguita euristicamente a ogni creazione di memoria (nessun costo LLM extra in lettura) e alimenta il graph utilizzato al momento del recupero. Non è interrogabile dall'utente come un graph oggi; il modello rivolto all'utente rimane «memorie / episodi / procedure».

Alma può sostituire Zep nel mio prodotto agente AI? A volte. Se il Suo agente è rivolto all'utente finale e le esigenze di memoria sono «ricordare preferenze, decisioni e contesto tra le sessioni», SDK + REST API di Alma su Max Le danno ciò che Le serve senza costruire un wrapper. Se Le servono query graph temporali esplicite, Zep è lo strumento giusto.

Alma è open source? No. Alma è un SaaS ospitato. Zep distribuisce una community edition open-source che può ospitare autonomamente.

In sintesi

Zep è progettato per team di ingegneria che distribuiscono agenti AI che necessitano di ragionamento graph temporale esplicito. Alma è lo strumento giusto quando vuole un prodotto di memoria completo (chat, Soul Engine, MCP, studi creativi) senza lavoro infrastrutturale, o quando Le serve un livello cognitivo per la propria app senza scrivere il modello di memoria tipizzato e il Soul Engine da soli. Il piano Starter ($14/mese) Le mostra il prodotto end-to-end in cinque minuti.

Vedi i piani · Vedi i piani · Documentazione sviluppatori e SDK

See plans