Aprile 2026 · lettura 9 min · Fran Olivares, Founder di OlivaresAI
Ogni grande piattaforma AI — ChatGPT, Claude, Gemini, Copilot — tratta le conversazioni come usa-e-getta. Lei spiega il Suo progetto, le Sue preferenze, i Suoi vincoli. L'AI risponde brillantemente. Chiude la scheda. Domani, ha dimenticato tutto. Non è un bug. È una scelta architetturale deliberata: inferenza stateless. Ed è la più grande limitazione che impedisce all'AI di essere genuinamente utile.
La statelessness ha conseguenze reali. Ogni conversazione inizia da zero. Lei rispiega il Suo stack tecnologico, le Sue convenzioni di codice, gli obiettivi del progetto, le Sue preferenze di comunicazione. Se usa AI quotidianamente, passa ore al mese fornendo contesto che l'AI dovrebbe già conoscere. Non è intelligenza: è inserimento dati.
Il costo va più in profondità del tempo sprecato. Senza memoria, l'AI non può costruire una comprensione progressiva. Non può riconoscere schemi tra le conversazioni. Non può imparare dalle correzioni. Non può sviluppare un modello accurato di chi è Lei e di cosa Le serve. Ogni interazione è ugualmente superficiale, indipendentemente che sia la prima o la millesima.
Ecco perché l'AI sembra ancora uno strumento piuttosto che un collaboratore. Un collega umano che dimenticasse tutto ogni mattina sarebbe inutile. Ci aspettiamo lo stesso dall'AI, ma abbiamo accettato un'asticella molto più bassa perché «così funzionano gli LLM».
OpenAI, Anthropic e Google hanno tutti rilasciato funzioni di memoria. Sono meglio di niente. Ma non sono la risposta.
ChatGPT Memory memorizza circa 1.400 parole in totale in tutte le Sue conversazioni. Non c'è un sistema di priorità: il modello decide cosa ricordare. Due grandi incidenti di azzeramento della memoria nel 2025 hanno cancellato mesi di contesto accumulato per migliaia di utenti. Non c'è esportazione, ricerca o organizzazione strutturata.
Claude Memory è limitata al progetto, il che è meglio per l'organizzazione. Ma funziona solo all'interno di Claude. Se usa Cursor per programmare, ChatGPT per scrivere e Claude per l'analisi, ha tre sistemi di memoria separati e incompatibili senza modo di unificarli.
Gemini Memory è simile: vincolata all'ecosistema Google. Il Suo contesto accumulato scompare nel momento in cui passa a un altro strumento.
Il problema fondamentale della memoria di piattaforma è il vincolo al fornitore. Le Sue memorie appartengono alla piattaforma, non a Lei. Non può esportarle, non può usarle con altri modelli ed è a un cambio di policy dalla perdita totale.
La memoria persistente non è «memoria aggiunta a un chatbot». È un livello di conoscenza indipendente che si trova tra Lei e qualsiasi modello AI. Ha cinque caratteristiche distintive:
La differenza tra AI stateless e AI con memoria non è incrementale: è categorica. Ecco cosa cambia:
Flussi di sviluppo — La Sua AI conosce il Suo stack, le Sue convenzioni, l'architettura del progetto e le decisioni passate. Non suggerisce React quando Lei usa Vue. Non propone schemi che ha esplicitamente rifiutato. Ricorda perché ha scelto PostgreSQL invece di MongoDB tre mesi fa.
Scrittura e comunicazione — La Sua AI impara la Sua voce, il Suo tono, la Sua struttura preferita. Produce bozze che suonano come Lei, non come un'AI generica. Ricorda le correzioni di stile e le applica in modo coerente.
Ricerca e analisi — Il contesto si costruisce nel corso delle settimane. La Sua AI ricorda i risultati precedenti, traccia ipotesi in evoluzione e collega nuove informazioni a fatti consolidati. La ricerca diventa cumulativa, non ripetitiva.
Apprendimento ed educazione — La Sua AI si adatta al Suo livello di conoscenza. Non spiega le basi che già comprende. Si basa sulle conversazioni precedenti, tracciando i Suoi progressi e regolando la complessità di conseguenza.
Una memoria persistente efficace non è unidimensionale. Alma usa un'architettura a tre livelli che rispecchia la cognizione umana:
Sopra questi tre livelli si trova il Soul Engine: un sistema di identità strutturato che definisce come l'AI dovrebbe pensare, comunicare e comportarsi. Non un singolo system prompt, ma blocchi organizzati per identità, personalità, competenze, regole e contesto che persistono ed evolvono.
Siamo a un punto di svolta. Negli ultimi tre anni, l'industria AI si è concentrata sulle capacità del modello: più parametri, finestre di contesto più ampie, ragionamento migliore. Questi miglioramenti contano. Ma non risolvono il problema fondamentale della statelessness. Un modello con una finestra di contesto da 1 milione di token dimentica ancora tutto quando la conversazione finisce.
La prossima ondata di valore AI verrà da sistemi che accumulano intelligenza nel tempo. La memoria è il fondamento. Senza di essa, ogni interazione AI è un avvio a freddo. Con essa, ogni interazione si basa su tutto ciò che è venuto prima.
Ecco perché abbiamo costruito Alma. Non un altro chatbot con una funzione di memoria aggiunta. Un livello di memoria persistente e indipendente che funziona con modelli, piattaforme e strumenti diversi. Vedi i piani: chat completa, server MCP, SDK e accesso API da $14/mese.