Quel est le moyen le plus simple de donner à l’IA une mémoire persistante ?

Installez le serveur MCP d’Alma (@olivaresai/alma-mcp) dans Claude Desktop, Cursor, Windsurf ou tout client compatible MCP. La mise en place prend environ cinq minutes et ne demande pas de code — il suffit d’ajouter le package au JSON de configuration de votre client avec votre clé API Alma.

Ai-je besoin d’une clé API pour utiliser la mémoire persistante d’Alma ?

Oui. Inscrivez-vous sur alma.olivares.ai, choisissez un plan payant et générez une clé API dans Settings. La même clé est utilisée par le serveur MCP, le JavaScript SDK et la REST API.

Puis-je utiliser la mémoire Alma avec ma propre application IA sur mesure ?

Oui — utilisez le JavaScript SDK (@olivaresai/alma-sdk) pour Node.js ou appelez la REST API depuis n’importe quel langage. Les deux exposent plus de 140 endpoints couvrant le CRUD de mémoire, la recherche sémantique et par mots-clés, l’assemblage de contexte, les blocs Soul et le streaming de chat.

Alma fonctionne-t-il avec Claude, ChatGPT, Gemini ou d’autres modèles ?

Alma est indépendant du modèle lorsqu’il est utilisé via le SDK ou la REST API : assemble context renvoie une simple chaîne que vous pouvez passer à n’importe quel LLM (Anthropic, OpenAI, Google, autres). L’application web sur alma.olivares.ai utilise directement Claude Haiku, Sonnet et Opus.

Comment donner à l’IA une mémoire persistante

Avril 2026 · 10 min de lecture · Fran Olivares, fondateur d’OlivaresAI

Il existe trois façons de donner à toute IA une mémoire persistante : installer un serveur MCP comme @olivaresai/alma-mcp dans la configuration de votre client en cinq minutes — sans code ; utiliser le JavaScript SDK pour récupérer le contexte avant les appels LLM et extraire les mémoires après ; ou appeler la REST API directement depuis n’importe quel langage. Les trois se connectent à la même couche mémoire d’Alma.

Chaque conversation IA repart de zéro. Votre assistant oublie votre nom, votre projet, vos préférences — à chaque fois. C’est la limitation fondamentale de l’IA sans état, et c’est la principale raison pour laquelle l’IA paraît être un outil plutôt qu’un collaborateur. Ce guide vous présente trois approches concrètes pour résoudre le problème, depuis la mise en place sans code jusqu’à l’intégration API complète.

Pourquoi l’IA oublie-t-elle chaque conversation ?

Quand vous utilisez ChatGPT, Claude ou tout chat IA, le contexte disparaît à la fin de la conversation. Vous expliquez les mêmes choses encore et encore : votre stack technique, votre style de codage, l’architecture de votre projet, vos préférences. Cela perd du temps et produit de moins bons résultats parce que l’IA ne construit jamais une compréhension profonde de qui vous êtes ni de ce sur quoi vous travaillez.

Les fonctions de mémoire natives des plateformes (ChatGPT Memory, Claude Projects) aident, mais elles sont limitées en capacité, verrouillées à une seule plateforme et n’offrent aucune API développeur. Si vous construisez un produit alimenté par l’IA, il vous faut une couche de mémoire indépendante.

Comment ajouter de la mémoire via le serveur MCP (sans code) ?

La Model Context Protocol (MCP) est le chemin le plus rapide. Si votre IA tourne dans Claude Desktop, Cursor, Windsurf, Claude Code ou tout client compatible MCP, vous pouvez ajouter une mémoire persistante en moins de 5 minutes.

Étape 1 : Inscrivez-vous sur alma.olivares.ai et générez une clé API dans Settings.

Étape 2 : Ajoutez @olivaresai/alma-mcp à la configuration de votre client MCP avec votre clé API. Pour Claude Desktop, éditez claude_desktop_config.json. Pour Cursor, utilisez le panneau de paramètres MCP.

Étape 3 : Redémarrez votre client. Le serveur expose 35 outils : alma_remember (sauvegarder une mémoire), alma_recall (chercher des mémoires), alma_assemble (construire le contexte depuis toutes les couches mémoire), alma_extract (extraire les faits d’un texte), et plus encore. Votre IA peut désormais lire et écrire dans un stockage mémoire persistant qui survit à chaque conversation.

MCP est idéal pour les workflows personnels — Claude Desktop pour le travail IA général, Cursor pour le code, Claude Code pour le développement en terminal. Une seule mémoire, partout.

Comment intégrer la mémoire IA avec le JavaScript SDK ?

La JavaScript SDK (@olivaresai/alma-sdk) vous donne le contrôle programmatique complet pour les applications sur mesure. Le schéma d’intégration de base a trois étapes :

Avant l’appel LLM : Appelez client.context.assemble({ query }) pour obtenir un prompt système enrichi de mémoires, épisodes, procédures et blocs Soul pertinents.
Passez à n’importe quel LLM : Le contexte assemblé est une simple chaîne. Passez-la comme prompt système à Anthropic, OpenAI, Gemini ou tout modèle. Votre couche de mémoire est indépendante du modèle.
Après l’appel LLM : Appelez client.memories.extract({ text }) pour sauvegarder les nouveaux faits de la conversation. Ou créez des mémoires directement avec client.memories.create().

Le SDK encapsule les plus de 140 endpoints API avec des types TypeScript complets. Installez avec npm install @olivaresai/alma-sdk. Il est ESM uniquement et requiert Node.js 18+.

Comment ajouter une mémoire IA via REST API depuis n’importe quel langage ?

La REST API fournit un accès HTTP direct depuis n’importe quel langage ou plateforme. Endpoints clés :

POST /api/v1/context/assemble — Construire un prompt de contexte depuis mémoires, épisodes, procédures et blocs Soul
POST /api/v1/memories — Créer une mémoire avec contenu, catégorie, importance et confiance
GET /api/v1/memories/search?q=query&mode=hybrid — Recherche hybride sémantique + mot-clé
POST /api/v1/memories/extract — Extraction de faits depuis un texte alimentée par LLM
POST /api/v1/blocks — Configurer les blocs Soul Engine pour l’identité de l’IA

L’authentification se fait via clé API (headerX-API-Key ). URL de base : https://alma.olivares.ai/api/v1.

Comment la couche mémoire d’Alma fonctionne-t-elle réellement ?

L’ architecture à trois couches d’Alma sépare la connaissance en trois types :

Mémoires — Faits et préférences discrets, indexés sémantiquement avec des embeddings vectoriels. Chacun possède importance, confiance, catégorie et métadonnées de source.
Épisodes — Résumés compressés de conversations. Ce qui a été discuté, décidé et appris.
Procédures — Workflows pas à pas et motifs comportementaux appris.

Quand vous démarrez une conversation, l’assemblage de contexte fouille les trois couches via une recherche hybride, pondère les résultats par pertinence (50 %), importance (15 %), confiance (15 %), récence (10 %) et fréquence (10 %), puis injecte le contexte le mieux classé dans le prompt système — le tout en moins de 100 ms.

Les mémoires sont automatiquement extraites des conversations tous les 4 messages. L’extracteur identifie 0 à 30 faits par conversation avec Claude Haiku. Les doublons sont détectés via la similarité de Jaccard (seuil 60 %) et fusionnés. Les mémoires obsolètes à faible importance expirent après 120 jours d’inactivité.

Comment donner à mon IA une identité cohérente ?

La mémoire seule donne à votre IA des faits. Le Soul Engine lui donne une identité. Configurez des blocs structurés — personnalité, expertise, style de communication, règles et contexte — qui persistent à travers chaque conversation. Contrairement à un seul prompt système qui se dilue dans les longues conversations, les blocs Soul Engine sont versionnés, organisés et toujours injectés en priorité.

Comment garder les contextes IA travail et personnel séparés ?

Les environnements vous permettent d’isoler les contextes mémoire. Gardez les mémoires de travail, personnelles et spécifiques à un client complètement séparées. Chaque environnement a ses propres mémoires, épisodes, procédures et blocs Soul. L’IA bascule sa personnalité et sa connaissance quand vous changez d’environnement.

Comment commencer à utiliser la mémoire persistante d’Alma ?

Commencez sur alma.olivares.ai. Le plan Starter ($14/mois) inclut les mémoires illimitées sur un budget IA hebdomadaire de $2, 1 environnement et l’accès complet au chat. Toutes les méthodes d’intégration — MCP, SDK, API — fonctionnent sur chaque plan.

Pour aller plus loin : Gestion de la mémoire IA : guide complet 2026 · Construire des assistants IA qui se souviennent de tout · Mémoire persistante vs RAG

See plans