Qual é a forma mais fácil de dar memória persistente à IA?

Instale o servidor MCP da Alma (@olivaresai/alma-mcp) em Claude Desktop, Cursor, Windsurf ou qualquer cliente compatível com MCP. A configuração demora cerca de cinco minutos e não requer código — apenas adicionar o pacote à configuração JSON do seu cliente com a sua chave de API Alma.

Preciso de uma chave de API para usar a memória persistente da Alma?

Sim. Registe-se em alma.olivares.ai, escolha um plano pago e gere uma chave de API em Settings. A mesma chave é usada pelo servidor MCP, pelo JavaScript SDK e pela REST API.

Posso usar a memória Alma com a minha própria aplicação de IA?

Sim — use o JavaScript SDK (@olivaresai/alma-sdk) para Node.js ou chame a REST API a partir de qualquer linguagem. Ambos expõem mais de 140 endpoints cobrindo CRUD de memória, pesquisa semântica e por palavra-chave, montagem de contexto, blocos Soul e streaming de chat.

A Alma funciona com Claude, ChatGPT, Gemini ou outros modelos?

A Alma é agnóstica em relação ao modelo quando usada via SDK ou REST API: a montagem de contexto devolve uma string simples que pode passar a qualquer LLM (Anthropic, OpenAI, Google, outros). A aplicação web em alma.olivares.ai usa Claude Haiku, Sonnet e Opus diretamente.

Como dar memória persistente à IA

Abril 2026 · 10 min de leitura · Fran Olivares, Fundador da OlivaresAI

Há três formas de dar memória persistente a qualquer IA: instalar um servidor MCP como @olivaresai/alma-mcp na configuração do seu cliente em cinco minutos — sem código; usar o JavaScript SDK para obter contexto antes das chamadas ao LLM e extrair memórias depois; ou chamar a REST API diretamente a partir de qualquer linguagem. Todas as três ligam-se à mesma camada de memória Alma.

Cada conversa de IA começa do zero. O seu assistente esquece o seu nome, o seu projeto, as suas preferências — sempre. Esta é a limitação fundamental da IA sem estado, e a maior razão pela qual a IA se sente como uma ferramenta em vez de um colaborador. Este guia percorre três abordagens concretas para o resolver, desde configuração sem código até integração completa via API.

Porque é que a IA esquece cada conversa?

Quando usa ChatGPT, Claude ou qualquer chat de IA, o contexto desaparece quando a conversa termina. Repete as mesmas coisas vezes sem conta: a sua stack tecnológica, o seu estilo de programação, a arquitetura do seu projeto, as suas preferências. Isto desperdiça tempo e produz piores resultados porque a IA nunca constrói uma compreensão profunda de quem é ou daquilo em que está a trabalhar.

As funcionalidades nativas de memória das plataformas (ChatGPT Memory, Claude Projects) ajudam, mas têm capacidade limitada, estão bloqueadas a uma única plataforma e não oferecem API para programadores. Se está a construir um produto alimentado por IA, precisa de uma camada de memória independente.

Como adiciono memória via servidor MCP (sem código)?

O Model Context Protocol (MCP) é o caminho mais rápido. Se a sua IA corre em Claude Desktop, Cursor, Windsurf, Claude Code ou qualquer cliente compatível com MCP, pode adicionar memória persistente em menos de 5 minutos.

Passo 1: Registe-se em alma.olivares.ai e gere uma chave de API em Settings.

Passo 2: Adicione @olivaresai/alma-mcp à configuração do seu cliente MCP com a sua chave de API. Para Claude Desktop, edite claude_desktop_config.json. Para Cursor, utilize o painel de definições MCP.

Passo 3: Reinicie o seu cliente. O servidor expõe 35 ferramentas: alma_remember (guardar uma memória), alma_recall (pesquisar memórias), alma_assemble (construir contexto a partir de todas as camadas de memória), alma_extract (extrair factos de texto) e mais. A sua IA pode agora ler e escrever num armazenamento de memória persistente que sobrevive a todas as conversas.

O MCP é ideal para fluxos pessoais — Claude Desktop para trabalho geral de IA, Cursor para programação, Claude Code para desenvolvimento no terminal. Uma memória, em todo o lado.

Como integro memória de IA usando o JavaScript SDK?

O JavaScript SDK (@olivaresai/alma-sdk) dá-lhe controlo programático completo para aplicações personalizadas. O padrão de integração principal tem três passos:

Antes da chamada ao LLM: Chame client.context.assemble({ query }) para obter um system prompt enriquecido com memórias, episódios, procedimentos e blocos Soul relevantes.
Passe a qualquer LLM: O contexto montado é uma string simples. Passe-o como system prompt a Anthropic, OpenAI, Gemini ou qualquer modelo. A sua camada de memória é agnóstica em relação ao modelo.
Após a chamada ao LLM: Chame client.memories.extract({ text }) para guardar novos factos da conversa. Ou crie memórias diretamente com client.memories.create().

O SDK envolve mais de 140 endpoints de API com tipos TypeScript completos. Instale com npm install @olivaresai/alma-sdk. É só ESM e requer Node.js 18+.

Como adiciono memória de IA via REST API a partir de qualquer linguagem?

A REST API fornece acesso HTTP direto a partir de qualquer linguagem ou plataforma. Endpoints principais:

POST /api/v1/context/assemble — Constrói um prompt de contexto a partir de memórias, episódios, procedimentos e blocos Soul
POST /api/v1/memories — Cria uma memória com conteúdo, categoria, importância e confiança
GET /api/v1/memories/search?q=query&mode=hybrid — Pesquisa híbrida semântica + palavra-chave
POST /api/v1/memories/extract — Extração de factos de texto alimentada por LLM
POST /api/v1/blocks — Configurar blocos do Soul Engine para identidade da IA

A autenticação é via chave de API (header X-API-Key). URL base: https://alma.olivares.ai/api/v1.

Como funciona realmente a camada de memória da Alma?

A arquitetura em três camadas da Alma separa conhecimento em três tipos:

Memórias — Factos e preferências discretos, indexados semanticamente com embeddings vetoriais. Cada uma tem importância, confiança, categoria e metadados de origem.
Episódios — Resumos comprimidos de conversa. O que foi discutido, decidido e aprendido.
Procedimentos — Fluxos de trabalho passo a passo e padrões comportamentais aprendidos.

Quando inicia uma conversa, a montagem de contexto pesquisa nas três camadas usando pesquisa híbrida, pontua resultados por relevância (50%), importância (15%), confiança (15%), recência (10%) e frequência (10%), e depois injeta o contexto mais bem pontuado no system prompt — tudo em menos de 100 ms.

As memórias são extraídas automaticamente das conversas a cada 4 mensagens. O extrator identifica 0-30 factos por conversa usando Claude Haiku. Os duplicados são detetados via semelhança de Jaccard (limiar de 60%) e fundidos. Memórias antigas com pouca importância expiram após 120 dias de inatividade.

Como dou à minha IA uma identidade consistente?

A memória sozinha dá factos à sua IA. O Soul Engine dá-lhe identidade. Configure blocos estruturados — personalidade, especialização, estilo de comunicação, regras e contexto — que persistem em todas as conversas. Ao contrário de um único system prompt que se dilui em conversas longas, os blocos do Soul Engine são versionados, organizados e sempre injetados com prioridade.

Como mantenho separados os contextos de trabalho e pessoal?

Os Environments permitem-lhe isolar contextos de memória. Mantenha memórias profissionais, pessoais e por cliente completamente separadas. Cada Environment tem as suas próprias memórias, episódios, procedimentos e blocos Soul. A IA muda de personalidade e conhecimento quando muda de Environment.

Como começo a usar a memória persistente da Alma?

Comece em alma.olivares.ai. O plano Starter ($14/mês) inclui memórias ilimitadas com um orçamento semanal de IA de $2, 1 Environment e acesso completo ao chat. Todos os métodos de integração — MCP, SDK, API — funcionam em todos os planos.

Para mais detalhe: Gestão de memória de IA: guia completo 2026 · Construir assistentes de IA que se lembram de tudo · Memória persistente vs RAG

See plans