Mai 2026 · 7 Min. Lesezeit · Fran Olivares, Gründer von OlivaresAI
@olivaresai/alma-mcp als Server, fügen Sie einen einzelnen Block JSON in Ihre MCP-Client-Konfiguration ein (Claude Desktop, Cursor, Windsurf, Claude Code oder einen anderen kompatiblen Client) mit Ihrem Alma-API-Schlüssel und starten Sie neu. Der Server stellt 35 Memory-Tools bereit, die die KI autonom aufrufen kann: eine Erinnerung speichern, Erinnerungen durchsuchen, Kontext assemblieren, Fakten extrahieren, Soul-Blöcke konfigurieren. Die gesamte Einrichtungszeit beträgt etwa fünf Minuten und funktioniert im kostenlosen Alma-Tarif.Das Model Context Protocol (MCP) ist der offene Standard, der es KI-Clients ermöglicht, mit externen Tools und Datenquellen zu sprechen. Sobald Ihr Client MCP spricht, können Sie einen Memory-Server anschließen, und die KI erhält sofort Tools, um einen persistenten Speicher zu lesen und zu beschreiben — über jede Konversation, jedes Projekt, jeden Tag hinweg. Dieser Leitfaden führt durch das fünfminütige Setup für die vier häufigsten Clients 2026 und beantwortet die Fragen, die danach aufkommen.
Wenn der Alma-MCP-Server verbunden ist, erhält Ihr KI-Client 35 neue Tools, die er aufrufen kann, ohne dass Sie etwas tippen müssen. Die wichtigsten: alma_remember (eine Tatsache oder Präferenz speichern), alma_recall (Erinnerungen per Natural-Language-Anfrage durchsuchen), alma_assemble_context (einen strukturierten Kontext für die aktuelle Frage aus allen Speicher-Schichten aufbauen), alma_extract (Fakten aus einem Textblock gewinnen), alma_update_block (Soul-Engine-Blöcke für KI-Identität konfigurieren), dazu Tools für Episodes, Procedures, Environments, Konversationen, Websuche, Dateigenerierung und mehr.
In der Praxis ruft die KI diese Tools auf, wenn der Nutzer etwas Speicher-Relevantes fragt. „Merk dir, dass ich ESM-Module bevorzuge" → die KI ruft alma_remember auf. „Auf welchen Stack haben wir uns für den neuen Service geeinigt?" → die KI ruft alma_recall auf. Der Tool-Roundtrip ist im Subsekundenbereich; der Nutzer sieht nur eine etwas durchdachtere Antwort.
Schritt 1. Registrieren Sie sich unter alma.olivares.ai. Beginnen Sie mit dem Starter-Tarif ($14/Monat) für die Einstiegsstufe.
Schritt 2. Generieren Sie unter Einstellungen → API-Schlüssel einen Schlüssel und kopieren Sie ihn.
Schritt 3. Öffnen Sie die Konfigurationsdatei von Claude Desktop. Unter macOS liegt sie unter ~/Library/Application Support/Claude/claude_desktop_config.json; unter Windows unter %APPDATA%\Claude\claude_desktop_config.json.
Schritt 4. Fügen Sie den Alma-Server innerhalb des mcpServers-Objekts hinzu: { "alma": { "command": "npx", "args": ["-y", "@olivaresai/alma-mcp"], "env": { "ALMA_API_KEY": "your-key" } } }. Falls mcpServers noch nicht existiert, erstellen Sie es auf der obersten Ebene des JSON.
Schritt 5. Starten Sie Claude Desktop neu. Die Alma-Tools erscheinen im Slash-Menü, und Claude kann sie autonom aufrufen. Probieren Sie: „merk dir, dass mein Lieblingseditor Helix ist". Einen Zug später: „Was ist mein Lieblingseditor?" — Claude erinnert sich.
Cursors MCP-UI liegt unter Einstellungen → Features → MCP. Fügen Sie einen neuen Server mit Name alma, Command npx, Args -y @olivaresai/alma-mcp hinzu und ergänzen Sie die Umgebungsvariable ALMA_API_KEY mit Ihrem Schlüssel. Speichern und Cursor neu starten. Die Alma-Tools erscheinen im Chat-Tool-Use-Indikator; sowohl Composer als auch der Inline-Chat haben Zugriff. Kombiniert mit Cursors Projektkontext gibt das der KI sowohl Bewusstsein für Ihre Codebasis als auch persistenten projektübergreifenden Speicher.
Windsurf liest MCP-Konfigurationen aus ~/.windsurf/mcp_config.json. Die Struktur spiegelt Claude Desktop wider: ein mcpServers-Objekt mit demselben Alma-Block. Starten Sie Windsurf nach dem Editieren neu. Die Alma-Tools erscheinen dann in Cascade, und Windsurf kann sie während agentischer Abläufe nutzen — besonders nützlich bei Multi-File-Refactorings, bei denen Sie wollen, dass die KI sich an Konventionen aus früheren Sitzungen erinnert.
Claude Code (der terminal-native Claude-Client) hat seine eigene MCP-Konfiguration unter ~/.config/claude-code/mcp.json. Fügen Sie denselben Alma-Block ein. Führen Sie claude mcp list aus, um zu prüfen, dass der Server registriert ist. Sobald verbunden, kann Claude Code Almas Tools während Coding-Sitzungen nutzen; besonders wirkungsvoll in Kombination mit dem Environments-Feature von Alma, sodass jedes Repo einen eigenen Speicher-Namespace hat. Siehe die Claude-Code-Integrationsdokumentation für das exakte JSON.
Almas MCP-Server spricht reines MCP über stdio, also funktioniert jeder konforme Client. Das Pattern ist immer dasselbe: Der Client erwartet einen Command + Args + Env-Konfigurationsblock, führt den Server als Kindprozess aus und erkennt Tools über den MCP-Handshake. Wenn Sie bei einem nicht gelisteten Client hängen, sagen Ihnen die Server-Logs (setzen Sie ALMA_DEBUG=1 in der Umgebung), ob der Handshake erfolgreich war.
Stack-Erfassung. Sagen Sie der KI „Ich verwende Bun + Hono + D1 für den neuen Service" — sie ruft alma_remember auf. Zwei Tage später in einer anderen Konversation: „Skizziere einen Route-Handler für /users" — die KI erinnert sich an den Stack und produziert idiomatischen Bun + Hono Code, ohne erneute Erklärung.
Entscheidungs-Logging. „Wir haben beschlossen, Redis für das MVP zu überspringen und D1 direkt zu verwenden." Der Agent speichert die Entscheidung mit Kategorie decision und hoher Wichtigkeit. Wochen später bei der Überprüfung der Architektur liefert „Warum kein Redis?" die ursprüngliche Entscheidung mit Begründung.
Client-übergreifende Kontinuität. Eine Erinnerung morgens in Claude Desktop speichern, nachmittags von Cursor aus darauf verweisen, abends vom Terminal aus mit Claude Code abfragen. Dasselbe Alma-Konto, derselbe Speicher, jeder Client sieht alles.
Ja. Almas MCP-Server stellt auch Ressourcen bereit (read-only Daten, die der Client abonnieren kann): soul, memories, environments, conversations, budget, blocks, episodes, procedures und mehr. Clients, die MCP-Ressourcen anzeigen (insbesondere Claude Desktop), zeigen diese in einer Sidebar und können Updates streamen. Sie können den gesamten Speicher von innerhalb Claude Desktop durchsuchen, ohne einen Browser zu öffnen.
Der MCP-Server tut nur, was die KI ihm sagt, und nur mit Ihrem API-Schlüssel — es gibt kein implizites Broadcasting. Alle Memory-Writes sind auf Ihr Alma-Konto begrenzt, im Ruhezustand verschlüsselt und auf Anfrage exportierbar. Der Server läuft lokal auf Ihrer Maschine; er leitet nichts über Dritte um, außer über die Alma-API selbst. Kostenseitig: Die Installation des Servers ist kostenlos; der Starter-Tarif ($14/Monat) ist Almas Einstiegsstufe und enthält alles Nötige, um den MCP-Server zu betreiben.
Sobald der Server läuft, ist der wirkungsvollste Schritt, Soul-Engine-Blöcke (Persönlichkeit, Expertise, Kommunikationsstil, harte Regeln) zu befüllen, damit die KI zusätzlich zum faktischen Speicher eine konsistente Identität hat. Die Alma-Web-App unter alma.olivares.ai stellt den Soul-Editor bereit; siehe Soul Engine: KI-Persönlichkeit, die bleibt für das vollständige Pattern.
Verwandte Lektüre: MCP-Server für KI-Speicher · Wie man KI persistenten Speicher gibt · Persistenter Speicher für KI: Vollständiger Leitfaden 2026 · MCP-Server-Dokumentation · Claude-Code-Integration.