Was ist der einfachste Weg, KI persistenten Speicher zu geben?

Installieren Sie den Alma-MCP-Server (@olivaresai/alma-mcp) in Claude Desktop, Cursor, Windsurf oder einen MCP-kompatiblen Client. Die Einrichtung dauert etwa fünf Minuten und erfordert keinen Code — nur das Hinzufügen des Pakets zur JSON-Konfiguration Ihres Clients mit Ihrem Alma-API-Schlüssel.

Kann ich Alma-Speicher mit meiner eigenen KI-App verwenden?

Ja — nutzen Sie das JavaScript SDK (@olivaresai/alma-sdk) für Node.js oder rufen Sie die REST API aus jeder Sprache auf. Beide stellen 140+ Endpunkte bereit, die Memory-CRUD, semantische und Keyword-Suche, Kontext-Assemblierung, Soul-Blöcke und Chat-Streaming abdecken.

Funktioniert Alma mit Claude, ChatGPT, Gemini oder anderen Modellen?

Alma ist modellunabhängig, wenn es über das SDK oder die REST API verwendet wird: Die Kontext-Assemblierung gibt einen einfachen String zurück, den Sie an jedes LLM (Anthropic, OpenAI, Google, andere) übergeben können. Die Web-App unter alma.olivares.ai nutzt Claude Haiku, Sonnet und Opus direkt.

Wie man KI persistenten Speicher gibt

Q: Brauche ich einen API-Schlüssel, um Almas persistenten Speicher zu nutzen?

Ja. Registrieren Sie sich unter alma.olivares.ai, wählen Sie einen kostenpflichtigen Tarif und generieren Sie einen API-Schlüssel in den Einstellungen. Derselbe Schlüssel wird vom MCP-Server, vom JavaScript SDK und von der REST API verwendet.

April 2026 · 10 Min. Lesezeit · Fran Olivares, Gründer von OlivaresAI

Es gibt drei Wege, jeder KI persistenten Speicher zu geben: einen MCP-Server wie @olivaresai/alma-mcp in fünf Minuten in Ihre Client-Konfiguration installieren — kein Code; das JavaScript SDK nutzen, um vor LLM-Aufrufen Kontext zu holen und danach Erinnerungen zu extrahieren; oder die REST API direkt aus jeder Sprache aufrufen. Alle drei verbinden sich mit derselben Alma-Speicherschicht.

Jede KI-Konversation beginnt bei null. Ihr Assistent vergisst Ihren Namen, Ihr Projekt, Ihre Präferenzen — jedes einzelne Mal. Das ist die grundlegende Einschränkung zustandsloser KI und der größte Grund, warum sich KI eher wie ein Werkzeug als wie ein Mitarbeiter anfühlt. Dieser Leitfaden führt Sie durch drei konkrete Ansätze, das zu lösen, vom Setup ohne Code bis zur vollständigen API-Integration.

Warum vergisst KI jede Konversation?

Wenn Sie ChatGPT, Claude oder einen beliebigen KI-Chat nutzen, verschwindet der Kontext, wenn die Konversation endet. Sie erklären dieselben Dinge immer wieder: Ihren Tech-Stack, Ihren Coding-Stil, Ihre Projektarchitektur, Ihre Präferenzen. Das verschwendet Zeit und führt zu schlechteren Ergebnissen, weil die KI nie ein tiefes Verständnis davon aufbaut, wer Sie sind oder woran Sie arbeiten.

Plattformeigene Memory-Funktionen (ChatGPT Memory, Claude Projects) helfen, sind aber in der Kapazität begrenzt, an eine einzige Plattform gebunden und bieten keine Entwickler-API. Wenn Sie ein KI-gestütztes Produkt bauen, brauchen Sie eine unabhängige Speicherschicht.

Wie füge ich Speicher über den MCP-Server hinzu (ohne Code)?

Das Model Context Protocol (MCP) ist der schnellste Weg. Wenn Ihre KI in Claude Desktop, Cursor, Windsurf, Claude Code oder einem MCP-kompatiblen Client läuft, können Sie persistenten Speicher in unter 5 Minuten hinzufügen.

Schritt 1: Registrieren Sie sich unter alma.olivares.ai und generieren Sie einen API-Schlüssel in den Einstellungen.

Schritt 2: Fügen Sie @olivaresai/alma-mcp mit Ihrem API-Schlüssel zu Ihrer MCP-Client-Konfiguration hinzu. Für Claude Desktop bearbeiten Sie claude_desktop_config.json. Für Cursor verwenden Sie das MCP-Einstellungsfenster.

Schritt 3: Starten Sie Ihren Client neu. Der Server stellt 35 Tools bereit: alma_remember (eine Erinnerung speichern), alma_recall (Erinnerungen durchsuchen), alma_assemble (Kontext aus allen Speicher-Schichten aufbauen), alma_extract (Fakten aus Text extrahieren) und mehr. Ihre KI kann nun einen persistenten Speicher lesen und beschreiben, der über jede Konversation hinweg bestehen bleibt.

MCP ist ideal für persönliche Workflows — Claude Desktop für allgemeine KI-Arbeit, Cursor zum Programmieren, Claude Code für terminalbasierte Entwicklung. Ein Speicher, überall.

Wie integriere ich KI-Speicher mit dem JavaScript SDK?

Das JavaScript SDK (@olivaresai/alma-sdk) gibt Ihnen vollständige programmatische Kontrolle für eigene Anwendungen. Das Kern-Integrationsmuster hat drei Schritte:

Vor dem LLM-Aufruf: Rufen Sie client.context.assemble({ query }) auf, um einen System-Prompt zu erhalten, der mit relevanten Memories, Episodes, Procedures und Soul-Blöcken angereichert ist.
An ein beliebiges LLM übergeben: Der assemblierte Kontext ist ein einfacher String. Übergeben Sie ihn als System-Prompt an Anthropic, OpenAI, Gemini oder ein beliebiges Modell. Ihre Speicherschicht ist modellunabhängig.
Nach dem LLM-Aufruf: Rufen Sie client.memories.extract({ text }) auf, um neue Fakten aus der Konversation zu speichern. Oder erstellen Sie Erinnerungen direkt mit client.memories.create().

Das SDK umfasst alle 140+ API-Endpunkte mit vollständigen TypeScript-Typen. Installation mit npm install @olivaresai/alma-sdk. Es ist ESM-only und erfordert Node.js 18+.

Wie füge ich KI-Speicher über die REST API aus einer beliebigen Sprache hinzu?

Die REST API bietet direkten HTTP-Zugriff aus jeder Sprache oder Plattform. Wichtige Endpunkte:

POST /api/v1/context/assemble — Erstellt einen Kontext-Prompt aus Memories, Episodes, Procedures und Soul-Blöcken
POST /api/v1/memories — Erstellt eine Erinnerung mit Inhalt, Kategorie, Wichtigkeit und Konfidenz
GET /api/v1/memories/search?q=query&mode=hybrid — Hybride semantische + Keyword-Suche
POST /api/v1/memories/extract — LLM-gestützte Extraktion von Fakten aus Text
POST /api/v1/blocks — Konfiguration von Soul-Engine-Blöcken für KI-Identität

Die Authentifizierung erfolgt über API-Schlüssel (X-API-Key-Header). Basis-URL: https://alma.olivares.ai/api/v1.

Wie funktioniert Almas Speicherschicht eigentlich?

Almas dreistufige Architektur trennt Wissen in drei Typen:

Memories — Diskrete Fakten und Präferenzen, semantisch indexiert mit Vektor-Embeddings. Jede hat Wichtigkeit, Konfidenz, Kategorie und Quellen-Metadaten.
Episodes — Komprimierte Konversationszusammenfassungen. Was diskutiert, entschieden und gelernt wurde.
Procedures — Gelernte Schritt-für-Schritt-Workflows und Verhaltensmuster.

Wenn Sie eine Konversation starten, durchsucht die Kontext-Assemblierung alle drei Schichten mit hybrider Suche, bewertet Ergebnisse nach Relevanz (50 %), Wichtigkeit (15 %), Konfidenz (15 %), Aktualität (10 %) und Häufigkeit (10 %) und speist dann den am höchsten bewerteten Kontext in den System-Prompt ein — alles in unter 100 ms.

Erinnerungen werden alle 4 Nachrichten automatisch aus Konversationen extrahiert. Der Extraktor identifiziert 0–30 Fakten pro Konversation mittels Claude Haiku. Duplikate werden über Jaccard-Ähnlichkeit (60 %-Schwelle) erkannt und zusammengeführt. Veraltete Erinnerungen mit geringer Wichtigkeit laufen nach 120 Tagen Inaktivität ab.

Wie gebe ich meiner KI eine konsistente Identität?

Speicher allein gibt Ihrer KI Fakten. Die Soul Engine gibt ihr Identität. Konfigurieren Sie strukturierte Blöcke — Persönlichkeit, Expertise, Kommunikationsstil, Regeln und Kontext — die über jede Konversation hinweg bestehen. Im Gegensatz zu einem einzelnen System-Prompt, der in langen Konversationen verwässert wird, sind Soul-Engine-Blöcke versioniert, organisiert und werden immer mit Priorität eingespeist.

Wie halte ich berufliche und private KI-Kontexte getrennt?

Environments ermöglichen es, Speicher-Kontexte zu isolieren. Halten Sie berufliche, private und kundenspezifische Erinnerungen vollständig getrennt. Jedes Environment hat seine eigenen Memories, Episodes, Procedures und Soul-Blöcke. Die KI wechselt Persönlichkeit und Wissen, wenn Sie das Environment wechseln.

Wie fange ich an, Almas persistenten Speicher zu nutzen?

Starten Sie unter alma.olivares.ai. Der Starter-Tarif ($14/Monat) enthält unbegrenzte Erinnerungen bei einem $2 wöchentlichen KI-Budget, 1 Environment und vollen Chat-Zugang. Alle Integrationsmethoden — MCP, SDK, API — funktionieren in jedem Tarif.

Für mehr Tiefe: KI-Speicherverwaltung: Vollständiger Leitfaden 2026 · KI-Assistenten bauen, die sich alles merken · Persistenter Speicher vs. RAG

See plans