Qual è il modo più semplice per dare memoria persistente all'AI?

Installi il server MCP di Alma (@olivaresai/alma-mcp) in Claude Desktop, Cursor, Windsurf o qualsiasi client compatibile con MCP. La configurazione richiede circa cinque minuti e non richiede codice: basta aggiungere il pacchetto alla configurazione JSON del client con la Sua API key Alma.

Mi serve una API key per usare la memoria persistente di Alma?

Sì. Si registri su alma.olivares.ai, scelga un piano a pagamento e generi una API key in Impostazioni. La stessa chiave viene utilizzata dal server MCP, dal JavaScript SDK e dalla REST API.

Posso usare la memoria di Alma con la mia app AI personalizzata?

Sì: usi il JavaScript SDK (@olivaresai/alma-sdk) per Node.js o chiami la REST API da qualsiasi linguaggio. Entrambi espongono 140+ endpoint che coprono CRUD della memoria, ricerca semantica e per parole chiave, assemblaggio del contesto, blocchi soul e streaming chat.

Alma funziona con Claude, ChatGPT, Gemini o altri modelli?

Alma è model-agnostic quando usato tramite SDK o REST API: l'assemblaggio del contesto restituisce una stringa semplice che può passare a qualsiasi LLM (Anthropic, OpenAI, Google, altri). La web app su alma.olivares.ai usa Claude Haiku, Sonnet e Opus direttamente.

Come dare memoria persistente all'AI

Aprile 2026 · lettura 10 min · Fran Olivares, Founder di OlivaresAI

Esistono tre modi per dare a qualsiasi AI memoria persistente: installare un server MCP come @olivaresai/alma-mcp nella configurazione del Suo client in cinque minuti, senza codice; usare il JavaScript SDK per recuperare il contesto prima delle chiamate LLM ed estrarre memorie dopo; oppure chiamare direttamente la REST API da qualsiasi linguaggio. Tutti e tre si collegano allo stesso livello di memoria Alma.

Ogni conversazione AI inizia da zero. Il Suo assistente dimentica il Suo nome, il Suo progetto, le Sue preferenze, ogni singola volta. Questa è la limitazione fondamentale dell'AI stateless ed è la ragione principale per cui l'AI sembra uno strumento invece di un collaboratore. Questa guida La accompagna in tre approcci concreti per risolverlo, dalla configurazione zero-code all'integrazione API completa.

Perché l'AI dimentica ogni conversazione?

Quando usa ChatGPT, Claude o qualsiasi chat AI, il contesto scompare quando la conversazione termina. Lei spiega le stesse cose più e più volte: il Suo stack tecnologico, lo stile di codice, l'architettura del progetto, le Sue preferenze. Questo fa perdere tempo e produce risultati peggiori perché l'AI non costruisce mai una comprensione profonda di chi è Lei o di cosa sta lavorando.

Le funzioni di memoria native delle piattaforme (ChatGPT Memory, Claude Projects) aiutano, ma sono limitate in capacità, vincolate a una sola piattaforma e non offrono API per sviluppatori. Se sta costruendo un prodotto basato su AI, Le serve un livello di memoria indipendente.

Come aggiungo memoria tramite il server MCP (senza codice)?

Il Model Context Protocol (MCP) è il percorso più rapido. Se la Sua AI funziona in Claude Desktop, Cursor, Windsurf, Claude Code o qualsiasi client compatibile con MCP, può aggiungere memoria persistente in meno di 5 minuti.

Passo 1: Si registri su alma.olivares.ai e generi una API key in Impostazioni.

Passo 2: Aggiunga @olivaresai/alma-mcp alla configurazione del Suo client MCP con la Sua API key. Per Claude Desktop, modifichi claude_desktop_config.json. Per Cursor, usi il pannello impostazioni MCP.

Passo 3: Riavvii il Suo client. Il server espone 35 strumenti: alma_remember (salva una memoria), alma_recall (cerca memorie), alma_assemble (costruisce il contesto da tutti i livelli di memoria), alma_extract (estrae fatti dal testo) e altri. La Sua AI può ora leggere e scrivere su un archivio di memoria persistente che sopravvive a ogni conversazione.

MCP è ideale per flussi di lavoro personali: Claude Desktop per lavoro AI generale, Cursor per programmazione, Claude Code per sviluppo da terminale. Una memoria, ovunque.

Come integro la memoria AI usando il JavaScript SDK?

Il JavaScript SDK (@olivaresai/alma-sdk) Le offre pieno controllo programmatico per applicazioni personalizzate. Il pattern di integrazione principale ha tre passi:

Prima della chiamata LLM: Chiami client.context.assemble({ query }) per ottenere un system prompt arricchito con memorie, episodi, procedure e blocchi soul rilevanti.
Passi a qualsiasi LLM: Il contesto assemblato è una stringa semplice. Lo passi come system prompt a Anthropic, OpenAI, Gemini o qualsiasi modello. Il Suo livello di memoria è model-agnostic.
Dopo la chiamata LLM: Chiami client.memories.extract({ text }) per salvare nuovi fatti dalla conversazione. Oppure crei memorie direttamente con client.memories.create().

L'SDK avvolge tutti i 140+ endpoint API con tipi TypeScript completi. Installi con npm install @olivaresai/alma-sdk. È solo ESM e richiede Node.js 18+.

Come aggiungo memoria AI tramite REST API da qualsiasi linguaggio?

La REST API fornisce accesso HTTP diretto da qualsiasi linguaggio o piattaforma. Endpoint principali:

POST /api/v1/context/assemble — Costruisce un prompt di contesto da memorie, episodi, procedure e blocchi soul
POST /api/v1/memories — Crea una memoria con contenuto, categoria, importanza e confidenza
GET /api/v1/memories/search?q=query&mode=hybrid — Ricerca ibrida semantica + parole chiave
POST /api/v1/memories/extract — Estrazione di fatti dal testo basata su LLM
POST /api/v1/blocks — Configura i blocchi Soul Engine per l'identità AI

L'autenticazione avviene tramite API key (header X-API-Key). URL di base: https://alma.olivares.ai/api/v1.

Come funziona davvero il livello di memoria di Alma?

L'architettura a tre livelli di Alma separa la conoscenza in tre tipi:

Memorie — Fatti e preferenze discreti, indicizzati semanticamente con vector embeddings. Ognuno ha importanza, confidenza, categoria e metadati di origine.
Episodi — Riassunti compressi di conversazioni. Cosa è stato discusso, deciso e appreso.
Procedure — Workflow appresi passo per passo e schemi comportamentali.

Quando inizia una conversazione, l'assemblaggio del contesto cerca in tutti e tre i livelli usando ricerca ibrida, assegna punteggi ai risultati per rilevanza (50%), importanza (15%), confidenza (15%), attualità (10%) e frequenza (10%), poi inietta il contesto al primo posto nel system prompt: tutto in meno di 100ms.

Le memorie vengono estratte automaticamente dalle conversazioni ogni 4 messaggi. L'estrattore identifica 0-30 fatti per conversazione usando Claude Haiku. I duplicati vengono rilevati tramite similarità di Jaccard (soglia 60%) e uniti. Le memorie obsolete con bassa importanza scadono dopo 120 giorni di inattività.

Come do alla mia AI un'identità coerente?

La memoria da sola dà fatti alla Sua AI. Il Soul Engine Le dà identità. Configuri blocchi strutturati (personalità, competenze, stile di comunicazione, regole e contesto) che persistono in ogni conversazione. A differenza di un singolo system prompt che si diluisce in conversazioni lunghe, i blocchi Soul Engine sono versionati, organizzati e sempre iniettati con priorità.

Come mantengo separati i contesti AI di lavoro e personali?

Gli ambienti Le permettono di isolare i contesti di memoria. Mantenga memorie di lavoro, personali e specifiche per cliente completamente separate. Ogni ambiente ha le proprie memorie, episodi, procedure e blocchi soul. L'AI cambia personalità e conoscenza quando Lei cambia ambiente.

Come inizio a usare la memoria persistente di Alma?

Inizi su alma.olivares.ai. Il piano Starter ($14/mese) include memorie illimitate su un budget AI settimanale di $2, 1 ambiente e accesso completo alla chat. Tutti i metodi di integrazione — MCP, SDK, API — funzionano su ogni piano.

Per maggiore approfondimento: Gestione della memoria AI: guida completa 2026 · Costruire assistenti AI che ricordano tutto · Memoria persistente vs RAG

See plans