2026年4月 · 読了時間 10 分 · Fran Olivares、OlivaresAI 創業者
@olivaresai/alma-mcp のような MCP サーバーをクライアントの設定に 5 分でインストールする(コード不要)、JavaScript SDK を使用して LLM 呼び出しの前にコンテキストを取得し後にメモリーを抽出する、または任意の言語から REST API を直接呼び出す。3 つすべてが同じ Alma メモリーレイヤーに接続します。あらゆる AI 会話はゼロから始まります。アシスタントはあなたの名前、プロジェクト、好みを毎回忘れます。これはステートレスな AI の根本的な制約であり、AI が協力者ではなくツールに感じられる最大の理由です。本ガイドでは、コード不要のセットアップから完全な API 統合まで、これを解決する 3 つの具体的なアプローチを説明します。
ChatGPT、Claude、その他の AI チャットを使うとき、会話が終わるとコンテキストは消失します。あなたは同じこと、つまり技術スタック、コーディングスタイル、プロジェクトのアーキテクチャ、好みを繰り返し説明します。これは時間の無駄であり、AI があなたが誰で何に取り組んでいるかについて深い理解を構築しないため、結果も悪化します。
プラットフォームネイティブなメモリー機能(ChatGPT Memory、Claude Projects)は役立ちますが、容量に制限があり、単一プラットフォームに固定されており、開発者 API を提供していません。AI 駆動のプロダクトを構築している場合、独立したメモリーレイヤーが必要です。
The Model Context Protocol(MCP) が最速の経路です。AI が Claude Desktop、Cursor、Windsurf、Claude Code、その他の MCP 互換クライアントで動作している場合、5 分未満で永続メモリーを追加できます。
ステップ 1: alma.olivares.ai にサインアップし、Settings で API キーを生成します。
ステップ 2: @olivaresai/alma-mcp を API キーと共に MCP クライアントの設定に追加します。Claude Desktop の場合は claude_desktop_config.json を編集します。Cursor の場合は MCP 設定パネルを使用します。
ステップ 3: クライアントを再起動します。サーバーは 35 のツールを公開します: alma_remember(メモリーを保存)、alma_recall(メモリーを検索)、alma_assemble(すべてのメモリーレイヤーからコンテキストを構築)、alma_extract(テキストから事実を抽出)など。AI はあらゆる会話で存続する永続メモリーストアの読み書きが可能になります。
MCP は個人ワークフローに最適です — 一般 AI 作業に Claude Desktop、コーディングに Cursor、ターミナルベースの開発に Claude Code。単一のメモリーをどこでも使えます。
The JavaScript SDK(@olivaresai/alma-sdk)は、カスタムアプリケーションに対する完全なプログラム制御を提供します。コア統合パターンは 3 ステップです:
client.context.assemble({ query }) を呼び出し、関連する Memories、Episodes、Procedures、Soul ブロックで強化されたシステムプロンプトを取得します。client.memories.extract({ text }) を呼び出して会話から新しい事実を保存します。または client.memories.create() で直接メモリーを作成します。SDK は完全な TypeScript 型で 140 を超えるすべての API エンドポイントをラップします。npm install @olivaresai/alma-sdk でインストールします。ESM のみで、Node.js 18 以上が必要です。
The REST API は、任意の言語またはプラットフォームから直接 HTTP アクセスを提供します。主要なエンドポイント:
POST /api/v1/context/assemble — Memories、Episodes、Procedures、Soul ブロックからコンテキストプロンプトを構築POST /api/v1/memories — content、category、importance、confidence を持つメモリーを作成GET /api/v1/memories/search?q=query&mode=hybrid — ハイブリッド(セマンティック + キーワード)検索POST /api/v1/memories/extract — LLM によるテキストからの事実抽出POST /api/v1/blocks — AI のアイデンティティのために Soul Engine ブロックを設定認証は API キー(X-API-Key ヘッダー)で行います。ベース URL: https://alma.olivares.ai/api/v1。
Alma's 3 層アーキテクチャ は知識を 3 つのタイプに分離します:
When you start a conversation, コンテキスト構築 はハイブリッド検索で 3 層すべてを検索し、関連性(50%)、重要性(15%)、信頼度(15%)、新しさ(10%)、頻度(10%)で結果をスコアリングし、最上位のコンテキストをシステムプロンプトに挿入します。すべて 100ms 未満で行います。
メモリーは 4 メッセージごとに会話から自動抽出されます。抽出器は Claude Haiku を使用して会話ごとに 0~30 件の事実を識別します。重複は Jaccard 類似度(60% しきい値)で検出され、マージされます。重要度の低い古いメモリーは 120 日間の非活動後に期限切れになります。
メモリーだけでは AI に事実を与えるだけです。Soul Engine はそれにアイデンティティを与えます。あらゆる会話で永続化される構造化ブロック(personality、expertise、コミュニケーションスタイル、ルール、context)を設定します。長い会話で薄められる単一のシステムプロンプトとは異なり、Soul Engine のブロックはバージョン管理され、整理され、常に優先的に挿入されます。
Environments はメモリーコンテキストを分離できます。仕事用、個人用、クライアント別のメモリーを完全に分離して維持します。各 Environment は独自の Memories、Episodes、Procedures、Soul ブロックを持ちます。Environment を切り替えると、AI はパーソナリティと知識を切り替えます。
alma.olivares.ai で始められます。Starter プラン($14/月)には、$2 の週次 AI 予算での無制限メモリー、1 Environment、完全なチャットアクセスが含まれます。すべての統合方法 — MCP、SDK、API — はすべてのプランで動作します。
詳細はこちら: AI メモリー管理: 2026 年完全ガイド · すべてを覚える AI アシスタントの構築 · 永続メモリー vs RAG