¿Cuál es la forma más fácil de dar memoria persistente a la IA?

Instalar el MCP server de Alma (@olivaresai/alma-mcp) en Claude Desktop, Cursor, Windsurf o cualquier cliente compatible con MCP. La configuración lleva unos cinco minutos y no requiere código — solo añadir el paquete al JSON de configuración del cliente con tu API key de Alma.

¿Necesito una API key para usar la memoria persistente de Alma?

Sí. Regístrate en alma.olivares.ai, elige un plan de pago y genera una API key en Settings. La misma key la usan el MCP server, el SDK de JavaScript y la REST API.

¿Puedo usar la memoria de Alma con mi propia app de IA?

Sí — usa el SDK de JavaScript (@olivaresai/alma-sdk) para Node.js o llama a la REST API desde cualquier lenguaje. Ambos exponen más de 140 endpoints que cubren CRUD de memorias, búsqueda semántica y por keyword, ensamblado de contexto, bloques soul y streaming de chat.

¿Funciona Alma con Claude, ChatGPT, Gemini u otros modelos?

Alma es model-agnostic cuando se usa vía SDK o REST API: assemble context devuelve un string plano que puedes pasar a cualquier LLM (Anthropic, OpenAI, Google, otros). La web app de alma.olivares.ai usa Claude Haiku, Sonnet y Opus directamente.

Cómo dar memoria persistente a la IA

Abril 2026 · 10 min de lectura · Fran Olivares, fundador de OlivaresAI

Hay tres formas de dar memoria persistente a cualquier IA: instalar un MCP server como @olivaresai/alma-mcp en la configuración de tu cliente en cinco minutos — sin código; usar el SDK de JavaScript para traer contexto antes de las llamadas al LLM y extraer memorias después; o llamar a la REST API directamente desde cualquier lenguaje. Las tres conectan a la misma capa de memoria de Alma.

Cada conversación con IA empieza desde cero. Tu asistente olvida tu nombre, tu proyecto, tus preferencias — cada vez. Esta es la limitación de fondo de la IA stateless, y la razón principal por la que la IA se siente como una herramienta en lugar de un colaborador. Esta guía recorre tres enfoques concretos para resolverlo, desde la configuración sin código hasta la integración completa por API.

¿Por qué la IA olvida cada conversación?

Cuando usas ChatGPT, Claude o cualquier chat de IA, el contexto desaparece al terminar la conversación. Explicas las mismas cosas una y otra vez: tu stack técnico, tu estilo de programación, la arquitectura de tu proyecto, tus preferencias. Esto desperdicia tiempo y produce peores resultados porque la IA nunca construye una comprensión profunda de quién eres ni de qué estás trabajando.

Las funciones de memoria nativas de las plataformas (ChatGPT Memory, Claude Projects) ayudan, pero tienen capacidad limitada, están ligadas a una sola plataforma y no ofrecen API para desarrolladores. Si estás construyendo un producto impulsado por IA, necesitas una capa de memoria independiente.

¿Cómo añado memoria vía el MCP server (sin código)?

El Model Context Protocol (MCP) es el camino más rápido. Si tu IA corre en Claude Desktop, Cursor, Windsurf, Claude Code o cualquier cliente compatible con MCP, puedes añadir memoria persistente en menos de 5 minutos.

Paso 1: Regístrate en alma.olivares.ai y genera una API key en Settings.

Paso 2: Añade @olivaresai/alma-mcp a la configuración de tu cliente MCP con tu API key. Para Claude Desktop, edita claude_desktop_config.json. Para Cursor, usa el panel de ajustes MCP.

Paso 3: Reinicia tu cliente. El server expone 35 tools: alma_remember (guarda una memoria), alma_recall (busca memorias), alma_assemble (construye contexto desde todas las capas de memoria), alma_extract (extrae hechos de un texto) y más. Tu IA ya puede leer y escribir en un almacén de memoria persistente que sobrevive a cada conversación.

MCP es ideal para flujos personales — Claude Desktop para trabajo general con IA, Cursor para programar, Claude Code para desarrollo en terminal. Una memoria, en todas partes.

¿Cómo integro memoria de IA usando el SDK de JavaScript?

El SDK de JavaScript (@olivaresai/alma-sdk) te da control programático total para aplicaciones a medida. El patrón de integración principal tiene tres pasos:

Antes de la llamada al LLM: Llama a client.context.assemble({ query }) para obtener un system prompt enriquecido con memorias relevantes, episodios, procedimientos y bloques soul.
Pasa a cualquier LLM: El contexto ensamblado es un string plano. Pásalo como system prompt a Anthropic, OpenAI, Gemini o cualquier modelo. Tu capa de memoria es model-agnostic.
Después de la llamada al LLM: Llama a client.memories.extract({ text }) para guardar los nuevos hechos de la conversación. O crea memorias directamente con client.memories.create().

El SDK envuelve más de 140 endpoints de API con tipos TypeScript completos. Instala con npm install @olivaresai/alma-sdk. Es solo-ESM y requiere Node.js 18+.

¿Cómo añado memoria de IA vía REST API desde cualquier lenguaje?

La REST API ofrece acceso HTTP directo desde cualquier lenguaje o plataforma. Endpoints clave:

POST /api/v1/context/assemble — Construye un prompt de contexto a partir de memorias, episodios, procedimientos y bloques soul
POST /api/v1/memories — Crea una memoria con contenido, categoría, importancia y confianza
GET /api/v1/memories/search?q=query&mode=hybrid — Búsqueda híbrida semántica + keyword
POST /api/v1/memories/extract — Extracción de hechos de texto impulsada por LLM
POST /api/v1/blocks — Configura los bloques de Soul Engine para la identidad de la IA

La autenticación es vía API key (cabecera X-API-Key). URL base: https://alma.olivares.ai/api/v1.

¿Cómo funciona realmente la capa de memoria de Alma?

La arquitectura de tres capas de Alma separa el conocimiento en tres tipos:

Memorias — Hechos y preferencias discretos, indexados semánticamente con vector embeddings. Cada uno tiene metadata de importancia, confianza, categoría y origen.
Episodios — Resúmenes comprimidos de conversaciones. Qué se habló, qué se decidió, qué se aprendió.
Procedimientos — Workflows paso a paso y patrones de comportamiento aprendidos.

Cuando inicias una conversación, el ensamblado de contexto consulta las tres capas con búsqueda híbrida, puntúa los resultados por relevancia (50%), importancia (15%), confianza (15%), recencia (10%) y frecuencia (10%), y luego inyecta el contexto mejor puntuado en el system prompt — todo en menos de 100 ms.

Las memorias se extraen automáticamente de las conversaciones cada 4 mensajes. El extractor identifica entre 0 y 30 hechos por conversación usando Claude Haiku. Los duplicados se detectan vía similitud de Jaccard (umbral del 60%) y se fusionan. Las memorias obsoletas con baja importancia expiran tras 120 días de inactividad.

¿Cómo le doy a mi IA una identidad coherente?

La memoria por sí sola da a tu IA hechos. El Soul Engine le da identidad. Configura bloques estructurados — personalidad, expertise, estilo de comunicación, reglas y contexto — que persisten en cada conversación. A diferencia de un único system prompt que se diluye en conversaciones largas, los bloques del Soul Engine están versionados, organizados y se inyectan siempre con prioridad.

¿Cómo mantengo separados el contexto de IA del trabajo y el personal?

Los Environments te permiten aislar contextos de memoria. Mantén memorias de trabajo, personales y por cliente completamente separadas. Cada entorno tiene sus propias memorias, episodios, procedimientos y bloques soul. La IA cambia su personalidad y conocimiento cuando cambias de entorno.

¿Cómo empiezo a usar la memoria persistente de Alma?

Empieza en alma.olivares.ai. El plan Starter ($14/mes) incluye memorias ilimitadas con un presupuesto semanal de IA de $2, 1 environment y acceso completo al chat. Todos los métodos de integración — MCP, SDK, API — funcionan en todos los planes.

Para profundizar: Gestión de memoria de IA: guía completa 2026 · Construye asistentes de IA que recuerdan todo · Memoria persistente vs RAG

See plans