Alma vs Zep

Q: Alma a-t-il une conscience temporelle ?

Oui — les mémoires portent des horodatages, les épisodes sont des résumés de conversations ordonnés dans le temps et la décroissance d’importance fait s’estomper naturellement les mémoires plus anciennes. Pas de langage de requête de graphe pour state-at-time-T ; c’est la fonctionnalité spécifique à Zep.

Q: Alma a-t-il un graphe de connaissances d’entités ?

Oui, en interne. L’extraction d’entités tourne heuristiquement à chaque création de mémoire (pas de coût LLM supplémentaire en lecture) et alimente le graphe utilisé au moment de la récupération. Il n’est pas interrogeable par l’utilisateur en tant que graphe aujourd’hui.

Q: Alma peut-il remplacer Zep dans mon produit d’agent IA ?

Parfois. Si votre agent est destiné à l’utilisateur final et que les besoins mémoire sont de se souvenir des préférences et décisions à travers les sessions, le SDK + REST API d’Alma en Max conviennent. Si vous avez besoin de requêtes de graphe temporel explicites, Zep est le bon outil.

Q: Alma est-il open source ?

Non. Alma est un SaaS hébergé. Zep livre une édition communautaire open-source que vous pouvez auto-héberger.

Mis à jour mai 2026

Zep est un produit d’infrastructure pour développeurs : un graphe de connaissances temporel qui extrait automatiquement des entités des conversations et suit l’évolution des faits dans le temps. Vous l’intégrez dans votre propre application IA via API ou SDK. Alma est un produit complet : application web, chat avec Claude, identité Soul Engine, serveur MCP, extension VSCode et studios créatifs — prêt à l’emploi sans écrire de code d’infrastructure.

Qu’est-ce que Zep ?

Zep est un backend de mémoire longue durée pour les agents IA. Son différenciateur central est le graphe de connaissances temporel: à mesure que les conversations affluent, Zep extrait automatiquement les entités (personnes, projets, produits, concepts), suit leurs attributs dans le temps, et laisse l’agent interroger « que savions-nous sur X à la date Y » ou « qu’est-ce qui a changé sur X entre alors et maintenant ». Le moteur de graphe Graphiti propulse cela ; le SDK et le produit cloud managé l’encapsulent.

Zep est positionné pour les équipes d’ingénierie qui construisent des agents IA à l’échelle — typiquement des produits SaaS B2B où l’IA gère des interactions multi-tours complexes et où l’équipe valorise le raisonnement par graphe typé plutôt que la récupération vectorielle à plat. La tarification est principalement entreprise / sur mesure ; une édition communautaire open-source existe pour l’auto-hébergement.

Qu’est-ce qu’Alma ?

Alma est un produit complet de mémoire persistante. Les utilisateurs finaux s’inscrivent sur alma.olivares.ai, discutent avec Anthropic Claude (Haiku, Sonnet, Opus 4.7 avec contexte 1M tokens) et la couche mémoire capture faits, préférences et décisions automatiquement. Le Soul Engine gère l’identité IA. Les studios Image, Vidéo, Musique et Code sont groupés dans Pro et Max. Les développeurs peuvent aussi utiliser le serveur MCP, le JavaScript SDK et la REST API sur le plan Max.

La mémoire est structurée en trois couches (mémoires, épisodes, procédures) avec une pondération à cinq facteurs. Les plans payants démarrent à $14/mois (Starter) avec accès complet au Soul Engine.

En quoi diffèrent-ils sur l’architecture mémoire ?

Le graphe de connaissances temporel de Zep est sa fonctionnalité la plus forte. Les entités sont des citoyens de première classe ; vous pouvez demander « qu’est-ce que le projet X ? », « qui travaille sur le projet X ? », « quand l’échéance a-t-elle changé ? » et Zep traverse le graphe pour répondre. C’est véritablement puissant quand l’IA doit raisonner sur les relations à travers de nombreuses entités et leur évolution dans le temps — typique de l’IA de support client, des agents de recherche et de l’automatisation de workflows B2B.

Le modèle à 3 couches d’Alma est opinioné sur la forme: mémoires (faits et préférences), épisodes (résumés de conversations) et procédures (workflows appris). L’extraction d’entités tourne heuristiquement à chaque création de mémoire (pas de coût LLM supplémentaire en lecture) et alimente un graphe de connaissances interne, mais le modèle visible par l’utilisateur reste les trois couches, pas le graphe lui-même. La récupération est hybride (sémantique + mot-clé) avec une pondération à cinq facteurs. Le compromis : moins de raisonnement par graphe explicite, mais un modèle mental beaucoup plus simple et un prompt assemblé fonctionnel en moins de 100 ms sans langage de requête de graphe à apprendre.

En quoi diffèrent-ils en matière d’utilisateur cible ?

Zep est de l’infrastructure : une équipe d’ingénierie l’intègre dans son produit IA. La plupart des utilisateurs ne voient jamais le nom de Zep ; ils voient votre produit, qui se trouve se souvenir d’eux. Alma est un produit : les utilisateurs finaux s’inscrivent directement, la marque Alma est l’expérience, et les développeurs sont un public additionnel servi par le SDK et le serveur MCP.

Si votre équipe construit un agent IA avec un raisonnement multi-entités sophistiqué au cœur, Zep a été conçu exactement pour ça. Si vous (ou votre équipe) voulez utiliser l’IA avec mémoire à travers les outils dans lesquels vous travaillez déjà — Cursor, Claude Desktop, VSCode — Alma le couvre sans écrire de code d’intégration.

Comparaison fonctionnalité par fonctionnalité

Fonctionnalité	Zep	Alma
Utilisateur cible	Développeurs / équipes d’ingénierie qui construisent des agents IA	Utilisateurs finaux + développeurs
Modèle mémoire	Graphe de connaissances temporel avec extraction d’entités (Graphiti)	3 couches (mémoires + épisodes + procédures) avec graphe d’entités interne
Application web / chat	Non — API et tableau de bord admin uniquement	Oui — chat complet avec streaming, outils, pièces jointes
Identité IA	Non fournie — apportez la vôtre	Soul Engine (13 blocs d’identité versionnés)
Conscience temporelle	De première classe — suit les changements d’entités dans le temps	Épisodes + horodatages mémoire + décroissance d’importance (pas de langage de requête de graphe)
Assemblage de contexte	À votre charge — les requêtes de graphe renvoient des données, vous construisez le prompt	Intégré — prompt système assemblé <100 ms, pondération à 5 facteurs
Intégrations	SDK, REST API, adaptateurs de frameworks	MCP (Claude Desktop / Cursor / Windsurf), VSCode, JS SDK, REST API
Outils créatifs	Aucun	Studios Image / Vidéo / Musique / Code en Pro et Max
BYOK	N/D	Oui en Max — Anthropic, Replicate, Leonardo, ElevenLabs
Complexité de mise en place	Élevée — concepts de base de graphes, travail d’intégration	Inscription et chat — zéro infrastructure pour les utilisateurs
Tarification	Édition communautaire open-source · cloud / entreprise (sur mesure)	Starter $14/mois · Pro $29/mois · Max $99/mois

Comparaison de prix

L’édition communautaire open-source de Zep est gratuite si vous auto-hébergez la base de graphes et écrivez le code d’intégration. Les niveaux cloud hébergé et entreprise sont sur devis et destinés aux équipes qui livrent des agents IA à l’échelle. La tarification d’Alma est simple et accessible aux utilisateurs finaux : Starter $14/mois (mémoires illimitées, Haiku + Sonnet), Pro $29/mois (ajoute Opus 4.7 avec contexte 1M tokens, environnements illimités et studios créatifs), Max $99/mois (ajoute API, serveur MCP, extension VSCode, SDK et BYOK). La facturation annuelle est « payez 10 mois, obtenez-en 12 » sur chaque plan payant.

Workflows courants en pratique

Mémoire utilisateur final à travers les outils. Un utilisateur veut une IA avec mémoire à travers Claude Desktop, Cursor, VSCode et le web. Zep n’a pas de produit utilisateur final — c’est de l’infrastructure à intégrer dans le produit de quelqu’un d’autre. Alma est le produit utilisateur final lui-même : inscrivez-vous, connectez le serveur MCP, et chaque client pris en charge a de la mémoire en cinq minutes.

Agent de support client B2B avec raisonnement temporel. Une équipe d’ingénierie construit un agent IA qui traite les tickets de support et doit raisonner sur « que savions-nous sur le compte X à la date Y » ou « quand les termes du contrat ont-ils changé ». Le graphe de connaissances temporel de Zep (Graphiti) est fait pour ça — les entités sont des citoyens de première classe, les attributs sont suivis dans le temps, les requêtes de graphe répondent naturellement aux questions temporelles. Le modèle typé à 3 couches d’Alma peut répondre à « que savons-nous sur X » via la recherche, mais n’expose pas de requêtes de graphe temporel explicites — c’est la force différenciée de Zep.

Développeur solo qui veut de la mémoire dans son propre side project IA. Un développeur construit un petit outil IA et veut une mémoire persistante sans monter une base de graphes, exécuter des migrations et écrire du code de requête de graphe. Le SDK d’Alma en Max ($99/mois) fournit une couche cognitive complète (mémoire + Soul + assemblage de contexte) avec une API HTTP. L’édition communautaire auto-hébergée de Zep est aussi gratuite pour ce cas mais demande un investissement d’ingénierie avant la livraison de la première fonctionnalité.

Quand choisir Zep ?

Choisissez Zep si vous êtes une équipe d’ingénierie qui construit un produit d’agent IA où le raisonnement temporel sur les entités est au cœur de l’expérience — une IA de support client suivant des comptes, un agent de recherche suivant des hypothèses sur plusieurs semaines, une automatisation de workflow d’entreprise qui doit savoir exactement quand un fait a changé et pourquoi. Le modèle de graphe paie quand « montre-moi l’état de l’entité X à la date Y » est une vraie requête à laquelle vous devez répondre. Vous écrirez du code d’intégration et probablement une UI wrapper ; c’est l’accord.

Quand choisir Alma ?

Choisissez Alma si vous voulez utiliser la mémoire IA plutôt que construire de l’infrastructure. Inscrivez-vous, commencez à discuter, et la mémoire fonctionne. Si vous travaillez aussi dans Cursor / Claude Desktop / VSCode / Windsurf, installez le serveur MCP (gratuit) et la même mémoire vous suit. Choisissez Alma si vous voulez une identité IA structurée (Soul Engine), des studios créatifs groupés ou un abonnement mono-utilisateur abordable. Les développeurs qui veulent intégrer Alma dans leurs propres applications obtiennent le SDK, le serveur MCP et la REST API sur le plan Max ($99/mois) — une couche cognitive complète au lieu d’un simple backend mémoire.

Foire aux questions

Alma a-t-il une conscience temporelle ? Oui, mais avec un modèle différent. Les mémoires portent des horodatages de création et de dernier accès ; les épisodes sont des résumés de conversations ordonnés dans le temps ; la décroissance d’importance (la pondération à 5 facteurs inclut la récence à 10 %) fait s’estomper naturellement les mémoires plus anciennes. Pas de langage de requête de graphe pour « l’état au temps T » — c’est la fonctionnalité différenciée de Zep, pas celle d’Alma.

Alma a-t-il un graphe de connaissances d’entités ? Oui, en interne. L’extraction d’entités tourne heuristiquement à chaque création de mémoire (pas de coût LLM supplémentaire en lecture) et alimente le graphe utilisé au moment de la récupération. Il n’est pas interrogeable par l’utilisateur en tant que graphe aujourd’hui ; le modèle visible par l’utilisateur reste « mémoires / épisodes / procédures ».

Alma peut-il remplacer Zep dans mon produit d’agent IA ? Parfois. Si votre agent est destiné à l’utilisateur final et que les besoins mémoire sont « se souvenir des préférences, décisions et contexte à travers les sessions », le SDK + REST API d’Alma en Max vous donnent ce qu’il vous faut sans construire de wrapper. Si vous avez besoin de requêtes de graphe temporel explicites, Zep est le bon outil.

Alma est-il open source ? Non. Alma est un SaaS hébergé. Zep livre une édition communautaire open-source que vous pouvez auto-héberger.

En résumé

Zep est fait pour les équipes d’ingénierie qui livrent des agents IA nécessitant un raisonnement par graphe temporel explicite. Alma est le bon outil quand vous voulez un produit mémoire complet (chat, Soul Engine, MCP, studios créatifs) sans travail d’infrastructure, ou quand vous avez besoin d’une couche cognitive pour votre propre application sans écrire vous-même le modèle de mémoire typée et le Soul Engine. Le plan Starter ($14/mois) vous montre le produit end-to-end en cinq minutes.

Voir les offres · Voir les offres · Documentation et SDK développeurs

See plans