Alma vs Zep

Atualizado em maio de 2026

Zep é um produto de infraestrutura para devs: um knowledge graph temporal que extrai entidades de conversas automaticamente e rastreia como fatos mudam ao longo do tempo. Você o integra no seu próprio app de IA via API ou SDK. Alma é um produto completo: app web, chat com Claude, identidade Soul Engine, MCP server, extensão VSCode e estúdios criativos — pronto para usar sem escrever código de infraestrutura.

O que é Zep?

Zep é um backend de memória de longo prazo para agentes de IA. Seu diferenciador central é o temporal knowledge graph: conforme as conversas entram, Zep extrai entidades automaticamente (pessoas, projetos, produtos, conceitos), rastreia seus atributos ao longo do tempo e deixa o agente consultar "o que sabíamos sobre X na data Y" ou "o que mudou sobre X entre antes e agora". O graph engine Graphiti alimenta isso; o SDK e o produto cloud gerenciado o envolvem.

Zep é posicionado para times de engenharia construindo agentes de IA em escala — tipicamente produtos B2B SaaS onde a IA lida com interações multi-turno complexas e o time valoriza raciocínio tipado de grafo sobre recuperação vetorial plana. O preço é majoritariamente enterprise / custom; existe uma edição community open-source para self-hosting.

O que é Alma?

Alma é um produto completo de memória persistente. Usuários finais se cadastram em alma.olivares.ai, conversam com Anthropic Claude (Haiku, Sonnet, Opus 4.7 com contexto de 1M tokens) e a camada de memória captura fatos, preferências e decisões automaticamente. O Soul Engine cuida da identidade de IA. Estúdios Image, Video, Music e Code vêm no bundle do Pro e Max. Desenvolvedores também podem usar o MCP server, o JavaScript SDK e a REST API no plano Max.

A memória é estruturada em três camadas (memories, episodes, procedures) com pontuação de cinco fatores. Os planos pagos começam em $14/mo (Starter) com acesso completo ao Soul Engine.

Como diferem na arquitetura de memória?

O temporal knowledge graph do Zep é seu feature mais forte. Entidades são cidadãs de primeira classe; você pode perguntar "o que é o projeto X?", "quem trabalha no projeto X?", "quando o deadline mudou?" e Zep atravessa o grafo para responder. Isso é genuinamente poderoso quando a IA precisa raciocinar sobre relações entre muitas entidades e como elas evoluem ao longo do tempo — típico de IA de customer-support, agentes de pesquisa e automação de fluxo B2B.

O modelo de 3 camadas da Alma é opinionado sobre forma: memories (fatos e preferências), episodes (resumos de conversa) e procedures (fluxos aprendidos). A extração de entidades roda heuristicamente em todo memory create (sem custo extra de LLM na leitura) e alimenta um knowledge graph interno, mas o modelo voltado ao usuário é as três camadas, não o grafo em si. A recuperação é híbrida (semântica + palavra-chave) com pontuação de cinco fatores. O trade-off: menos raciocínio explícito de grafo, mas um modelo mental muito mais simples e um prompt montado funcional em menos de 100ms sem linguagem de query de grafo para aprender.

Como diferem no usuário-alvo?

Zep é infraestrutura: um time de engenharia o integra no produto de IA. A maioria dos usuários nunca vê o nome Zep; eles veem seu produto, que por acaso lembra deles. Alma é um produto: usuários finais se cadastram diretamente, a marca Alma é a experiência, e desenvolvedores são um público adicional servido pelo SDK e MCP server.

Se seu time está construindo um agente de IA com raciocínio sofisticado multi-entidade no coração, Zep foi projetado exatamente para isso. Se você (ou seu time) quer usar IA com memória entre as ferramentas em que já trabalha — Cursor, Claude Desktop, VSCode — Alma cobre isso sem escrever código de integração.

Comparação feature por feature

FeatureZepAlma
Usuário-alvoDesenvolvedores / times de engenharia construindo agentes de IAUsuários finais + desenvolvedores
Modelo de memóriaTemporal knowledge graph com extração de entidades (Graphiti)3 camadas (memories + episodes + procedures) com grafo de entidades interno
App web / chatNão — apenas API e dashboard adminSim — chat completo com streaming, tools, anexos de arquivo
Identidade de IANão fornecida — bring your ownSoul Engine (13 blocos de identidade versionados)
Consciência temporalFirst-class — rastreia mudanças de entidade ao longo do tempoEpisodes + timestamps de memory + decaimento de importância (sem linguagem de query de grafo)
Montagem de contextoBring your own — queries de grafo devolvem dados, você constrói o promptEmbutida — system prompt montado <100ms, pontuação de 5 fatores
IntegraçõesSDK, REST API, adapters de frameworkMCP (Claude Desktop / Cursor / Windsurf), VSCode, JS SDK, REST API
Ferramentas criativasNenhumaEstúdios Image / Video / Music / Code em Pro e Max
BYOKN/ASim no Max — Anthropic, Replicate, Leonardo, ElevenLabs
Complexidade de setupAlta — conceitos de graph DB, trabalho de integraçãoCadastre-se e converse — zero infraestrutura para usuários
PreçoEdição community open-source · cloud / enterprise (custom)Starter $14/mo · Pro $29/mo · Max $99/mo

Comparação de preços

A edição community open-source do Zep roda gratuitamente se você auto-hospedar o banco de grafo e escrever o código de integração. Os tiers cloud e enterprise hospedados são cotados sob demanda e mirados em times entregando agentes de IA em escala. O preço da Alma é direto e amigável a usuário final: Starter $14/mo (memories ilimitadas, Haiku + Sonnet), Pro $29/mo (adiciona Opus 4.7 com contexto de 1M tokens, environments ilimitados e estúdios criativos), Max $99/mo (adiciona API, MCP server, extensão VSCode, SDK e BYOK). Faturamento anual é "pague 10 meses, ganhe 12" em todo plano pago.

Fluxos comuns na prática

Memória de usuário final entre ferramentas. Um usuário quer IA com memória entre Claude Desktop, Cursor, VSCode e a web. Zep não tem produto end-user — é infraestrutura para embedar no produto de outra pessoa. Alma é o produto end-user em si: cadastre-se, conecte o MCP server e cada cliente suportado tem memória em cinco minutos.

Agente de customer-support B2B com raciocínio temporal. Um time de engenharia está construindo um agente de IA que lida com tickets de suporte e precisa raciocinar sobre "o que sabíamos sobre a conta X na data Y" ou "quando os termos do contrato mudaram". O temporal knowledge graph do Zep (Graphiti) é purpose-built para isso — entidades são cidadãs de primeira classe, atributos são rastreados ao longo do tempo, queries de grafo respondem as perguntas temporais naturalmente. O modelo tipado de 3 camadas da Alma pode responder "o que sabemos sobre X" via busca, mas não expõe queries de grafo temporais explícitas — essa é a força diferenciada do Zep.

Dev solo querendo memória no seu próprio side project de IA. Um desenvolvedor está construindo uma pequena ferramenta de IA e quer memória persistente sem subir um banco de grafo, rodar migrations e escrever código de query de grafo. O SDK da Alma no Max ($99/mo) fornece uma camada cognitiva completa (memória + Soul + montagem de contexto) com uma API HTTP. A edição community self-hosted do Zep também é gratuita para esse caso mas espera investimento de engenharia antes do primeiro feature entregar.

Quando devo escolher Zep?

Escolha Zep se você é um time de engenharia construindo um produto de agente de IA onde o raciocínio temporal de entidades é central para a experiência — uma IA de customer-support rastreando contas, um agente de pesquisa seguindo hipóteses entre semanas, uma automação de fluxo enterprise que precisa saber exatamente quando um fato mudou e por quê. O modelo de grafo compensa quando "me mostre o estado da entidade X na data Y" é uma query real que você precisa responder. Você vai escrever código de integração e provavelmente uma UI wrapper; esse é o trade.

Quando devo escolher Alma?

Escolha Alma se você quer usar memória de IA em vez de construir infraestrutura. Cadastre-se, comece a conversar e a memória funciona. Se você também trabalha em Cursor / Claude Desktop / VSCode / Windsurf, instale o MCP server (gratuito) e a mesma memória te acompanha. Escolha Alma se você quer uma identidade de IA estruturada (Soul Engine), estúdios criativos no bundle ou uma assinatura single-user acessível. Desenvolvedores que querem embedar Alma nos próprios apps recebem o SDK, MCP server e REST API no plano Max ($99/mo) — uma camada cognitiva completa em vez de só um backend de memória.

Perguntas frequentes

Alma tem consciência temporal? Sim, mas com um modelo diferente. Memories carregam timestamps de criação e último acesso; episodes são resumos de conversa ordenados por tempo; o decaimento de importância (a pontuação de 5 fatores inclui recência 10%) deixa memories mais velhas desbotarem naturalmente. Não há linguagem de query de grafo para "estado no tempo T" — esse é o feature diferenciado do Zep, não da Alma.

Alma tem um knowledge graph de entidades? Sim, internamente. A extração de entidades roda heuristicamente em todo memory create (sem custo extra de LLM na leitura) e alimenta o grafo usado no momento da recuperação. Não é consultável pelo usuário como um grafo hoje; o modelo voltado ao usuário fica em "memories / episodes / procedures".

Alma pode substituir Zep no meu produto de agente de IA? Às vezes. Se seu agente é voltado ao usuário final e as necessidades de memória são "lembrar preferências, decisões e contexto entre sessões", o SDK + REST API da Alma no Max te dão o que você precisa sem construir um wrapper. Se você precisa de queries de grafo temporais explícitas, Zep é a ferramenta certa.

Alma é open source? Não. Alma é um SaaS hospedado. Zep entrega uma edição community open-source que você pode auto-hospedar.

Conclusão

Zep é purpose-built para times de engenharia entregando agentes de IA que precisam de raciocínio temporal explícito de grafo. Alma é a ferramenta certa quando você quer um produto completo de memória (chat, Soul Engine, MCP, estúdios criativos) sem trabalho de infraestrutura, ou quando você precisa de uma camada cognitiva para seu próprio app sem escrever o modelo de memória tipado e Soul Engine sozinho. O plano Starter ($14/mo) te mostra o produto end-to-end em cinco minutos.

Ver planos · Ver planos · Docs para desenvolvedores e SDK

See plans