Abril 2026 · 10 min de leitura · Fran Olivares, Fundador da OlivaresAI
@olivaresai/alma-mcp na configuração do seu cliente em cinco minutos — sem código; usar o JavaScript SDK para obter contexto antes das chamadas ao LLM e extrair memórias depois; ou chamar a REST API diretamente a partir de qualquer linguagem. Todas as três ligam-se à mesma camada de memória Alma.Cada conversa de IA começa do zero. O seu assistente esquece o seu nome, o seu projeto, as suas preferências — sempre. Esta é a limitação fundamental da IA sem estado, e a maior razão pela qual a IA se sente como uma ferramenta em vez de um colaborador. Este guia percorre três abordagens concretas para o resolver, desde configuração sem código até integração completa via API.
Quando usa ChatGPT, Claude ou qualquer chat de IA, o contexto desaparece quando a conversa termina. Repete as mesmas coisas vezes sem conta: a sua stack tecnológica, o seu estilo de programação, a arquitetura do seu projeto, as suas preferências. Isto desperdiça tempo e produz piores resultados porque a IA nunca constrói uma compreensão profunda de quem é ou daquilo em que está a trabalhar.
As funcionalidades nativas de memória das plataformas (ChatGPT Memory, Claude Projects) ajudam, mas têm capacidade limitada, estão bloqueadas a uma única plataforma e não oferecem API para programadores. Se está a construir um produto alimentado por IA, precisa de uma camada de memória independente.
O Model Context Protocol (MCP) é o caminho mais rápido. Se a sua IA corre em Claude Desktop, Cursor, Windsurf, Claude Code ou qualquer cliente compatível com MCP, pode adicionar memória persistente em menos de 5 minutos.
Passo 1: Registe-se em alma.olivares.ai e gere uma chave de API em Settings.
Passo 2: Adicione @olivaresai/alma-mcp à configuração do seu cliente MCP com a sua chave de API. Para Claude Desktop, edite claude_desktop_config.json. Para Cursor, utilize o painel de definições MCP.
Passo 3: Reinicie o seu cliente. O servidor expõe 35 ferramentas: alma_remember (guardar uma memória), alma_recall (pesquisar memórias), alma_assemble (construir contexto a partir de todas as camadas de memória), alma_extract (extrair factos de texto) e mais. A sua IA pode agora ler e escrever num armazenamento de memória persistente que sobrevive a todas as conversas.
O MCP é ideal para fluxos pessoais — Claude Desktop para trabalho geral de IA, Cursor para programação, Claude Code para desenvolvimento no terminal. Uma memória, em todo o lado.
O JavaScript SDK (@olivaresai/alma-sdk) dá-lhe controlo programático completo para aplicações personalizadas. O padrão de integração principal tem três passos:
client.context.assemble({ query }) para obter um system prompt enriquecido com memórias, episódios, procedimentos e blocos Soul relevantes.client.memories.extract({ text }) para guardar novos factos da conversa. Ou crie memórias diretamente com client.memories.create().O SDK envolve mais de 140 endpoints de API com tipos TypeScript completos. Instale com npm install @olivaresai/alma-sdk. É só ESM e requer Node.js 18+.
A REST API fornece acesso HTTP direto a partir de qualquer linguagem ou plataforma. Endpoints principais:
POST /api/v1/context/assemble — Constrói um prompt de contexto a partir de memórias, episódios, procedimentos e blocos SoulPOST /api/v1/memories — Cria uma memória com conteúdo, categoria, importância e confiançaGET /api/v1/memories/search?q=query&mode=hybrid — Pesquisa híbrida semântica + palavra-chavePOST /api/v1/memories/extract — Extração de factos de texto alimentada por LLMPOST /api/v1/blocks — Configurar blocos do Soul Engine para identidade da IAA autenticação é via chave de API (header X-API-Key). URL base: https://alma.olivares.ai/api/v1.
A arquitetura em três camadas da Alma separa conhecimento em três tipos:
Quando inicia uma conversa, a montagem de contexto pesquisa nas três camadas usando pesquisa híbrida, pontua resultados por relevância (50%), importância (15%), confiança (15%), recência (10%) e frequência (10%), e depois injeta o contexto mais bem pontuado no system prompt — tudo em menos de 100 ms.
As memórias são extraídas automaticamente das conversas a cada 4 mensagens. O extrator identifica 0-30 factos por conversa usando Claude Haiku. Os duplicados são detetados via semelhança de Jaccard (limiar de 60%) e fundidos. Memórias antigas com pouca importância expiram após 120 dias de inatividade.
A memória sozinha dá factos à sua IA. O Soul Engine dá-lhe identidade. Configure blocos estruturados — personalidade, especialização, estilo de comunicação, regras e contexto — que persistem em todas as conversas. Ao contrário de um único system prompt que se dilui em conversas longas, os blocos do Soul Engine são versionados, organizados e sempre injetados com prioridade.
Os Environments permitem-lhe isolar contextos de memória. Mantenha memórias profissionais, pessoais e por cliente completamente separadas. Cada Environment tem as suas próprias memórias, episódios, procedimentos e blocos Soul. A IA muda de personalidade e conhecimento quando muda de Environment.
Comece em alma.olivares.ai. O plano Starter ($14/mês) inclui memórias ilimitadas com um orçamento semanal de IA de $2, 1 Environment e acesso completo ao chat. Todos os métodos de integração — MCP, SDK, API — funcionam em todos os planos.
Para mais detalhe: Gestão de memória de IA: guia completo 2026 · Construir assistentes de IA que se lembram de tudo · Memória persistente vs RAG