Abril de 2026 · 10 min de leitura · Fran Olivares, fundador da OlivaresAI
@olivaresai/alma-mcp na configuração do seu cliente em cinco minutos — sem código; usar o JavaScript SDK para buscar contexto antes das chamadas ao LLM e extrair memories depois; ou chamar a REST API diretamente de qualquer linguagem. As três se conectam à mesma camada de memória da Alma.Toda conversa com IA começa do zero. Seu assistente esquece seu nome, seu projeto, suas preferências — todas as vezes. Essa é a limitação fundamental da IA stateless, e é o maior motivo por que IA parece uma ferramenta em vez de um colaborador. Este guia te leva por três abordagens concretas para resolvê-lo, do setup zero-código à integração completa via API.
Quando você usa ChatGPT, Claude ou qualquer chat de IA, o contexto desaparece quando a conversa termina. Você explica as mesmas coisas várias vezes: seu tech stack, seu estilo de código, sua arquitetura de projeto, suas preferências. Isso desperdiça tempo e produz resultados piores porque a IA nunca constrói um entendimento profundo de quem você é ou no que você está trabalhando.
Features de memória nativas da plataforma (ChatGPT Memory, Claude Projects) ajudam, mas são limitadas em capacidade, presas a uma única plataforma e sem API para desenvolvedores. Se você está construindo um produto powered by IA, você precisa de uma camada de memória independente.
O Model Context Protocol (MCP) é o caminho mais rápido. Se sua IA roda em Claude Desktop, Cursor, Windsurf, Claude Code ou qualquer cliente compatível com MCP, você pode adicionar memória persistente em menos de 5 minutos.
Passo 1: Cadastre-se em alma.olivares.ai e gere uma chave de API em Settings.
Passo 2: Adicione @olivaresai/alma-mcp à configuração do seu cliente MCP com sua chave de API. Para Claude Desktop, edite claude_desktop_config.json. Para Cursor, use o painel de configurações MCP.
Passo 3: Reinicie seu cliente. O servidor expõe 35 tools: alma_remember (salvar uma memory), alma_recall (buscar memories), alma_assemble (construir contexto de todas as camadas de memória), alma_extract (extrair fatos de texto) e mais. Sua IA agora consegue ler e escrever em um armazenamento de memória persistente que sobrevive a toda conversa.
MCP é ideal para fluxos pessoais — Claude Desktop para trabalho geral com IA, Cursor para programação, Claude Code para desenvolvimento baseado em terminal. Uma memória, em todos os lugares.
O JavaScript SDK (@olivaresai/alma-sdk) te dá controle programático completo para aplicações customizadas. O padrão central de integração tem três passos:
client.context.assemble({ query }) para obter um system prompt enriquecido com memories, episodes, procedures e blocos soul relevantes.client.memories.extract({ text }) para salvar novos fatos da conversa. Ou crie memories diretamente com client.memories.create().O SDK encapsula todos os 140+ endpoints da API com tipos TypeScript completos. Instale com npm install @olivaresai/alma-sdk. É ESM-only e exige Node.js 18+.
A REST API fornece acesso HTTP direto a partir de qualquer linguagem ou plataforma. Endpoints-chave:
POST /api/v1/context/assemble — Constrói um prompt de contexto a partir de memories, episodes, procedures e blocos soulPOST /api/v1/memories — Cria uma memory com content, category, importance e confidenceGET /api/v1/memories/search?q=query&mode=hybrid — Busca híbrida semântica + por palavra-chavePOST /api/v1/memories/extract — Extração de fatos de texto powered by LLMPOST /api/v1/blocks — Configura blocos do Soul Engine para identidade da IAAutenticação via chave de API (header X-API-Key). URL base: https://alma.olivares.ai/api/v1.
A arquitetura em três camadas da Alma separa o conhecimento em três tipos:
Quando você inicia uma conversa, a montagem de contexto busca nas três camadas usando busca híbrida, pontua resultados por relevância (50%), importância (15%), confiança (15%), recência (10%) e frequência (10%), depois injeta o contexto top-rankeado no system prompt — tudo em menos de 100ms.
Memories são automaticamente extraídas das conversas a cada 4 mensagens. O extrator identifica 0-30 fatos por conversa usando Claude Haiku. Duplicatas são detectadas via similaridade de Jaccard (limiar de 60%) e mescladas. Memories stale com baixa importância expiram depois de 120 dias de inatividade.
Memória sozinha dá à sua IA fatos. O Soul Engine dá identidade. Configure blocos estruturados — personalidade, expertise, estilo de comunicação, regras e contexto — que persistem em toda conversa. Diferente de um único system prompt que se dilui em conversas longas, os blocos do Soul Engine são versionados, organizados e sempre injetados com prioridade.
Environments te deixam isolar contextos de memória. Mantenha memories de trabalho, pessoal e por cliente completamente separadas. Cada environment tem suas próprias memories, episodes, procedures e blocos soul. A IA troca de personalidade e conhecimento quando você troca de environment.
Comece em alma.olivares.ai. O plano Starter ($14/mo) inclui memories ilimitadas com um budget semanal de IA de $2, 1 environment e acesso completo ao chat. Todos os métodos de integração — MCP, SDK, API — funcionam em todo plano.
Para mais profundidade: Gestão de memória de IA: guia completo 2026 · Construindo assistentes de IA que lembram de tudo · Memória persistente vs RAG