Abril 2026 · 10 min de lectura · Fran Olivares, fundador de OlivaresAI
@olivaresai/alma-mcp en la configuración de tu cliente en cinco minutos — sin código; usar el SDK de JavaScript para traer contexto antes de las llamadas al LLM y extraer memorias después; o llamar a la REST API directamente desde cualquier lenguaje. Las tres conectan a la misma capa de memoria de Alma.Cada conversación con IA empieza desde cero. Tu asistente olvida tu nombre, tu proyecto, tus preferencias — cada vez. Esta es la limitación de fondo de la IA stateless, y la razón principal por la que la IA se siente como una herramienta en lugar de un colaborador. Esta guía recorre tres enfoques concretos para resolverlo, desde la configuración sin código hasta la integración completa por API.
Cuando usas ChatGPT, Claude o cualquier chat de IA, el contexto desaparece al terminar la conversación. Explicas las mismas cosas una y otra vez: tu stack técnico, tu estilo de programación, la arquitectura de tu proyecto, tus preferencias. Esto desperdicia tiempo y produce peores resultados porque la IA nunca construye una comprensión profunda de quién eres ni de qué estás trabajando.
Las funciones de memoria nativas de las plataformas (ChatGPT Memory, Claude Projects) ayudan, pero tienen capacidad limitada, están ligadas a una sola plataforma y no ofrecen API para desarrolladores. Si estás construyendo un producto impulsado por IA, necesitas una capa de memoria independiente.
El Model Context Protocol (MCP) es el camino más rápido. Si tu IA corre en Claude Desktop, Cursor, Windsurf, Claude Code o cualquier cliente compatible con MCP, puedes añadir memoria persistente en menos de 5 minutos.
Paso 1: Regístrate en alma.olivares.ai y genera una API key en Settings.
Paso 2: Añade @olivaresai/alma-mcp a la configuración de tu cliente MCP con tu API key. Para Claude Desktop, edita claude_desktop_config.json. Para Cursor, usa el panel de ajustes MCP.
Paso 3: Reinicia tu cliente. El server expone 35 tools: alma_remember (guarda una memoria), alma_recall (busca memorias), alma_assemble (construye contexto desde todas las capas de memoria), alma_extract (extrae hechos de un texto) y más. Tu IA ya puede leer y escribir en un almacén de memoria persistente que sobrevive a cada conversación.
MCP es ideal para flujos personales — Claude Desktop para trabajo general con IA, Cursor para programar, Claude Code para desarrollo en terminal. Una memoria, en todas partes.
El SDK de JavaScript (@olivaresai/alma-sdk) te da control programático total para aplicaciones a medida. El patrón de integración principal tiene tres pasos:
client.context.assemble({ query }) para obtener un system prompt enriquecido con memorias relevantes, episodios, procedimientos y bloques soul.client.memories.extract({ text }) para guardar los nuevos hechos de la conversación. O crea memorias directamente con client.memories.create().El SDK envuelve más de 140 endpoints de API con tipos TypeScript completos. Instala con npm install @olivaresai/alma-sdk. Es solo-ESM y requiere Node.js 18+.
La REST API ofrece acceso HTTP directo desde cualquier lenguaje o plataforma. Endpoints clave:
POST /api/v1/context/assemble — Construye un prompt de contexto a partir de memorias, episodios, procedimientos y bloques soulPOST /api/v1/memories — Crea una memoria con contenido, categoría, importancia y confianzaGET /api/v1/memories/search?q=query&mode=hybrid — Búsqueda híbrida semántica + keywordPOST /api/v1/memories/extract — Extracción de hechos de texto impulsada por LLMPOST /api/v1/blocks — Configura los bloques de Soul Engine para la identidad de la IALa autenticación es vía API key (cabecera X-API-Key). URL base: https://alma.olivares.ai/api/v1.
La arquitectura de tres capas de Alma separa el conocimiento en tres tipos:
Cuando inicias una conversación, el ensamblado de contexto consulta las tres capas con búsqueda híbrida, puntúa los resultados por relevancia (50%), importancia (15%), confianza (15%), recencia (10%) y frecuencia (10%), y luego inyecta el contexto mejor puntuado en el system prompt — todo en menos de 100 ms.
Las memorias se extraen automáticamente de las conversaciones cada 4 mensajes. El extractor identifica entre 0 y 30 hechos por conversación usando Claude Haiku. Los duplicados se detectan vía similitud de Jaccard (umbral del 60%) y se fusionan. Las memorias obsoletas con baja importancia expiran tras 120 días de inactividad.
La memoria por sí sola da a tu IA hechos. El Soul Engine le da identidad. Configura bloques estructurados — personalidad, expertise, estilo de comunicación, reglas y contexto — que persisten en cada conversación. A diferencia de un único system prompt que se diluye en conversaciones largas, los bloques del Soul Engine están versionados, organizados y se inyectan siempre con prioridad.
Los Environments te permiten aislar contextos de memoria. Mantén memorias de trabajo, personales y por cliente completamente separadas. Cada entorno tiene sus propias memorias, episodios, procedimientos y bloques soul. La IA cambia su personalidad y conocimiento cuando cambias de entorno.
Empieza en alma.olivares.ai. El plan Starter ($14/mes) incluye memorias ilimitadas con un presupuesto semanal de IA de $2, 1 environment y acceso completo al chat. Todos los métodos de integración — MCP, SDK, API — funcionan en todos los planes.
Para profundizar: Gestión de memoria de IA: guía completa 2026 · Construye asistentes de IA que recuerdan todo · Memoria persistente vs RAG