Come dare memoria persistente all'AI

Aprile 2026 · lettura 10 min · Fran Olivares, Founder di OlivaresAI

Esistono tre modi per dare a qualsiasi AI memoria persistente: installare un server MCP come @olivaresai/alma-mcp nella configurazione del Suo client in cinque minuti, senza codice; usare il JavaScript SDK per recuperare il contesto prima delle chiamate LLM ed estrarre memorie dopo; oppure chiamare direttamente la REST API da qualsiasi linguaggio. Tutti e tre si collegano allo stesso livello di memoria Alma.

Ogni conversazione AI inizia da zero. Il Suo assistente dimentica il Suo nome, il Suo progetto, le Sue preferenze, ogni singola volta. Questa è la limitazione fondamentale dell'AI stateless ed è la ragione principale per cui l'AI sembra uno strumento invece di un collaboratore. Questa guida La accompagna in tre approcci concreti per risolverlo, dalla configurazione zero-code all'integrazione API completa.

Perché l'AI dimentica ogni conversazione?

Quando usa ChatGPT, Claude o qualsiasi chat AI, il contesto scompare quando la conversazione termina. Lei spiega le stesse cose più e più volte: il Suo stack tecnologico, lo stile di codice, l'architettura del progetto, le Sue preferenze. Questo fa perdere tempo e produce risultati peggiori perché l'AI non costruisce mai una comprensione profonda di chi è Lei o di cosa sta lavorando.

Le funzioni di memoria native delle piattaforme (ChatGPT Memory, Claude Projects) aiutano, ma sono limitate in capacità, vincolate a una sola piattaforma e non offrono API per sviluppatori. Se sta costruendo un prodotto basato su AI, Le serve un livello di memoria indipendente.

Come aggiungo memoria tramite il server MCP (senza codice)?

Il Model Context Protocol (MCP) è il percorso più rapido. Se la Sua AI funziona in Claude Desktop, Cursor, Windsurf, Claude Code o qualsiasi client compatibile con MCP, può aggiungere memoria persistente in meno di 5 minuti.

Passo 1: Si registri su alma.olivares.ai e generi una API key in Impostazioni.

Passo 2: Aggiunga @olivaresai/alma-mcp alla configurazione del Suo client MCP con la Sua API key. Per Claude Desktop, modifichi claude_desktop_config.json. Per Cursor, usi il pannello impostazioni MCP.

Passo 3: Riavvii il Suo client. Il server espone 35 strumenti: alma_remember (salva una memoria), alma_recall (cerca memorie), alma_assemble (costruisce il contesto da tutti i livelli di memoria), alma_extract (estrae fatti dal testo) e altri. La Sua AI può ora leggere e scrivere su un archivio di memoria persistente che sopravvive a ogni conversazione.

MCP è ideale per flussi di lavoro personali: Claude Desktop per lavoro AI generale, Cursor per programmazione, Claude Code per sviluppo da terminale. Una memoria, ovunque.

Come integro la memoria AI usando il JavaScript SDK?

Il JavaScript SDK (@olivaresai/alma-sdk) Le offre pieno controllo programmatico per applicazioni personalizzate. Il pattern di integrazione principale ha tre passi:

L'SDK avvolge tutti i 140+ endpoint API con tipi TypeScript completi. Installi con npm install @olivaresai/alma-sdk. È solo ESM e richiede Node.js 18+.

Come aggiungo memoria AI tramite REST API da qualsiasi linguaggio?

La REST API fornisce accesso HTTP diretto da qualsiasi linguaggio o piattaforma. Endpoint principali:

L'autenticazione avviene tramite API key (header X-API-Key). URL di base: https://alma.olivares.ai/api/v1.

Come funziona davvero il livello di memoria di Alma?

L'architettura a tre livelli di Alma separa la conoscenza in tre tipi:

Quando inizia una conversazione, l'assemblaggio del contesto cerca in tutti e tre i livelli usando ricerca ibrida, assegna punteggi ai risultati per rilevanza (50%), importanza (15%), confidenza (15%), attualità (10%) e frequenza (10%), poi inietta il contesto al primo posto nel system prompt: tutto in meno di 100ms.

Le memorie vengono estratte automaticamente dalle conversazioni ogni 4 messaggi. L'estrattore identifica 0-30 fatti per conversazione usando Claude Haiku. I duplicati vengono rilevati tramite similarità di Jaccard (soglia 60%) e uniti. Le memorie obsolete con bassa importanza scadono dopo 120 giorni di inattività.

Come do alla mia AI un'identità coerente?

La memoria da sola dà fatti alla Sua AI. Il Soul Engine Le dà identità. Configuri blocchi strutturati (personalità, competenze, stile di comunicazione, regole e contesto) che persistono in ogni conversazione. A differenza di un singolo system prompt che si diluisce in conversazioni lunghe, i blocchi Soul Engine sono versionati, organizzati e sempre iniettati con priorità.

Come mantengo separati i contesti AI di lavoro e personali?

Gli ambienti Le permettono di isolare i contesti di memoria. Mantenga memorie di lavoro, personali e specifiche per cliente completamente separate. Ogni ambiente ha le proprie memorie, episodi, procedure e blocchi soul. L'AI cambia personalità e conoscenza quando Lei cambia ambiente.

Come inizio a usare la memoria persistente di Alma?

Inizi su alma.olivares.ai. Il piano Starter ($14/mese) include memorie illimitate su un budget AI settimanale di $2, 1 ambiente e accesso completo alla chat. Tutti i metodi di integrazione — MCP, SDK, API — funzionano su ogni piano.

Per maggiore approfondimento: Gestione della memoria AI: guida completa 2026 · Costruire assistenti AI che ricordano tutto · Memoria persistente vs RAG

See plans