Alma vs Zep

Atualizado em maio de 2026

Zep é um produto de infraestrutura para programadores: um grafo de conhecimento temporal que extrai automaticamente entidades de conversas e segue como os factos mudam ao longo do tempo. É integrado na sua própria aplicação de IA via API ou SDK. A Alma é um produto completo: aplicação web, chat com Claude, identidade Soul Engine, servidor MCP, extensão VSCode e estúdios criativos — pronta a usar sem escrever código de infraestrutura.

O que é o Zep?

Zep é um backend de memória de longo prazo para agentes de IA. O seu diferenciador principal é o grafo de conhecimento temporal: à medida que as conversas chegam, o Zep extrai automaticamente entidades (pessoas, projetos, produtos, conceitos), segue os seus atributos ao longo do tempo e permite ao agente consultar "o que sabíamos sobre X na data Y" ou "o que mudou sobre X entre então e agora". O motor de grafo Graphiti alimenta isto; o SDK e o produto cloud gerido envolvem-no.

Zep está posicionado para equipas de engenharia que constroem agentes de IA em escala — tipicamente produtos B2B SaaS onde a IA trata de interações multi-turno complexas e a equipa valoriza raciocínio tipado de grafo sobre recuperação vetorial plana. O preço é maioritariamente enterprise / personalizado; existe uma edição comunitária open source para auto-alojamento.

O que é a Alma?

Alma é um produto completo de memória persistente. Os utilizadores finais registam-se em alma.olivares.ai, conversam com Anthropic Claude (Haiku, Sonnet, Opus 4.7 com 1M de contexto) e a camada de memória captura factos, preferências e decisões automaticamente. O Soul Engine trata da identidade da IA. Os estúdios Image, Video, Music e Code estão incluídos em Pro e Max. Os programadores podem também usar o servidor MCP, o JavaScript SDK e a REST API no plano Max.

A memória está estruturada em três camadas (memórias, episódios, procedimentos) com pontuação de cinco fatores. Os planos pagos começam em $14/mês (Starter) com acesso completo ao Soul Engine.

Em que diferem na arquitetura de memória?

O grafo de conhecimento temporal do Zep é a sua característica mais forte. As entidades são cidadãs de primeira classe; pode perguntar "o que é o projeto X?", "quem trabalha no projeto X?", "quando mudou o prazo?" e o Zep percorre o grafo para responder. Isto é genuinamente poderoso quando a IA precisa de raciocinar sobre relações entre muitas entidades e como evoluem ao longo do tempo — típico de IA de apoio ao cliente, agentes de investigação e automatização de fluxos B2B.

O modelo de 3 camadas da Alma é opinativo quanto à forma: memórias (factos e preferências), episódios (resumos de conversas) e procedimentos (fluxos de trabalho aprendidos). A extração de entidades corre heuristicamente em cada criação de memória (sem custo adicional de LLM na leitura) e alimenta um grafo de conhecimento interno, mas o modelo voltado para o utilizador são as três camadas, não o próprio grafo. A recuperação é híbrida (semântica + palavra-chave) com pontuação de cinco fatores. A contrapartida: menos raciocínio de grafo explícito, mas um modelo mental muito mais simples e um prompt montado e funcional em menos de 100 ms sem linguagem de consulta de grafo para aprender.

Em que diferem no utilizador-alvo?

Zep é infraestrutura: uma equipa de engenharia integra-a no seu produto de IA. A maioria dos utilizadores nunca vê o nome Zep; veem o seu produto, que por acaso se lembra deles. A Alma é um produto: os utilizadores finais registam-se diretamente, a marca Alma é a experiência, e os programadores são uma audiência adicional servida pelo SDK e servidor MCP.

Se a sua equipa está a construir um agente de IA com raciocínio multi-entidade sofisticado no centro, Zep foi desenhado exatamente para isso. Se o utilizador (ou a sua equipa) quer usar IA com memória entre as ferramentas em que já trabalha — Cursor, Claude Desktop, VSCode — a Alma cobre isso sem escrever qualquer código de integração.

Comparação funcionalidade a funcionalidade

FuncionalidadeZepAlma
Utilizador-alvoProgramadores / equipas de engenharia a construir agentes de IAUtilizadores finais + programadores
Modelo de memóriaGrafo de conhecimento temporal com extração de entidades (Graphiti)3 camadas (memórias + episódios + procedimentos) com grafo de entidades interno
Aplicação web / chatNão — apenas API e painel de administraçãoSim — chat completo com streaming, ferramentas, anexos de ficheiros
Identidade de IANão fornecida — traga a suaSoul Engine (13 blocos versionados de identidade)
Consciência temporalDe primeira classe — segue mudanças de entidades ao longo do tempoEpisódios + timestamps de memória + decaimento de importância (sem linguagem de consulta de grafo)
Montagem de contextoTraga a sua — consultas de grafo devolvem dados, o utilizador constrói o promptIntegrada — system prompt montado <100 ms, pontuação de 5 fatores
IntegraçõesSDK, REST API, adaptadores de frameworkMCP (Claude Desktop / Cursor / Windsurf), VSCode, JS SDK, REST API
Ferramentas criativasNenhumaEstúdios Image / Video / Music / Code em Pro e Max
BYOKN/DSim em Max — Anthropic, Replicate, Leonardo, ElevenLabs
Complexidade de configuraçãoAlta — conceitos de DB de grafo, trabalho de integraçãoRegistar e conversar — zero infraestrutura para utilizadores
PreçosEdição comunitária open source · cloud / enterprise (personalizado)Starter $14/mês · Pro $29/mês · Max $99/mês

Comparação de preços

A edição comunitária open source do Zep é gratuita se auto-alojar a base de dados de grafo e escrever o código de integração. As camadas cloud alojada e enterprise são cotadas a pedido e dirigidas a equipas que entregam agentes de IA em escala. O preço da Alma é direto e amigável para o utilizador final: Starter $14/mês (memórias ilimitadas, Haiku + Sonnet), Pro $29/mês (acrescenta Opus 4.7 com 1M de contexto, Environments ilimitados e estúdios criativos), Max $99/mês (acrescenta API, servidor MCP, extensão VSCode, SDK e BYOK). A faturação anual é "pague 10 meses, receba 12" em todos os planos pagos.

Fluxos de trabalho comuns na prática

Memória de utilizador final entre ferramentas. Um utilizador quer IA com memória entre Claude Desktop, Cursor, VSCode e a web. Zep não tem produto para utilizador final — é infraestrutura para integrar no produto de outra pessoa. A Alma é o próprio produto para utilizador final: registar, ligar o servidor MCP, e cada cliente suportado tem memória em cinco minutos.

Agente B2B de apoio ao cliente com raciocínio temporal. Uma equipa de engenharia está a construir um agente de IA que trata de tickets de apoio e precisa de raciocinar sobre "o que sabíamos sobre a conta X na data Y" ou "quando mudaram os termos do contrato". O grafo de conhecimento temporal do Zep (Graphiti) foi feito para isto — entidades são cidadãs de primeira classe, atributos são seguidos ao longo do tempo, consultas de grafo respondem naturalmente às perguntas temporais. O modelo tipado de 3 camadas da Alma consegue responder "o que sabemos sobre X" via pesquisa, mas não expõe consultas explícitas de grafo temporal — essa é a força diferenciada do Zep.

Programador solo a querer memória no seu próprio projeto secundário de IA. Um programador está a construir uma pequena ferramenta de IA e quer memória persistente sem montar uma base de dados de grafo, correr migrações e escrever código de consulta de grafo. O SDK da Alma em Max ($99/mês) fornece uma camada cognitiva completa (memória + Soul + montagem de contexto) com uma API HTTP. A edição comunitária auto-alojada do Zep também é gratuita para este caso mas exige investimento de engenharia antes da primeira funcionalidade entrar em produção.

Quando escolher o Zep?

Escolha Zep se é uma equipa de engenharia que constrói um produto de agente de IA onde o raciocínio temporal de entidades é central para a experiência — uma IA de apoio ao cliente que segue contas, um agente de investigação que segue hipóteses ao longo de semanas, uma automatização de fluxos enterprise que precisa de saber exatamente quando um facto mudou e porquê. O modelo de grafo compensa quando "mostra-me o estado da entidade X na data Y" é uma consulta real que precisa de responder. Vai escrever código de integração e provavelmente uma UI wrapper; é esse o acordo.

Quando escolher a Alma?

Escolha a Alma se quer usar memória de IA em vez de construir infraestrutura. Registe-se, comece a conversar, e a memória funciona. Se também trabalha em Cursor / Claude Desktop / VSCode / Windsurf, instale o servidor MCP (gratuito) e a mesma memória segue-o. Escolha a Alma se quer uma identidade de IA estruturada (Soul Engine), estúdios criativos incluídos ou uma subscrição single-user acessível. Programadores que querem integrar a Alma nas suas próprias aplicações obtêm o SDK, servidor MCP e REST API no plano Max ($99/mês) — uma camada cognitiva completa em vez de apenas um backend de memória.

Perguntas frequentes

A Alma tem consciência temporal? Sim, mas com um modelo diferente. As memórias carregam timestamps de criação e último acesso; os episódios são resumos de conversa ordenados por tempo; o decaimento de importância (pontuação de 5 fatores inclui recência a 10%) deixa as memórias mais antigas desvanecer naturalmente. Não há linguagem de consulta de grafo para "estado no tempo T" — essa é a funcionalidade diferenciada do Zep, não da Alma.

A Alma tem um grafo de conhecimento de entidades? Sim, internamente. A extração de entidades corre heuristicamente em cada criação de memória (sem custo adicional de LLM na leitura) e alimenta o grafo usado no momento da recuperação. Não é consultável pelo utilizador como grafo hoje; o modelo voltado para o utilizador mantém-se "memórias / episódios / procedimentos".

A Alma pode substituir o Zep no meu produto de agente de IA? Por vezes. Se o seu agente é voltado para utilizador final e as necessidades de memória são "lembrar preferências, decisões e contexto entre sessões", o SDK + REST API da Alma em Max dão-lhe o que precisa sem construir um wrapper. Se precisa de consultas explícitas de grafo temporal, Zep é a ferramenta certa.

A Alma é open source? Não. A Alma é SaaS alojado. Zep disponibiliza uma edição comunitária open source que pode auto-alojar.

Em resumo

Zep foi feito para equipas de engenharia que entregam agentes de IA que precisam de raciocínio explícito de grafo temporal. A Alma é a ferramenta certa quando quer um produto de memória completo (chat, Soul Engine, MCP, estúdios criativos) sem trabalho de infraestrutura, ou quando precisa de uma camada cognitiva para a sua própria aplicação sem escrever o modelo de memória tipado e o Soul Engine ele próprio. O plano Starter ($14/mês) mostra-lhe o produto de ponta a ponta em cinco minutos.

Ver planos · Ver planos · Documentação para programadores e SDK

See plans