Abril 2026 · 9 min de leitura · Fran Olivares, Fundador da OlivaresAI
Cada grande plataforma de IA — ChatGPT, Claude, Gemini, Copilot — trata as conversas como descartáveis. Explica o seu projeto, as suas preferências, as suas restrições. A IA responde de forma brilhante. Fecha o separador. Amanhã, esqueceu tudo. Isto não é um bug. É uma escolha arquitetural deliberada: inferência sem estado. E é a maior limitação que impede a IA de ser genuinamente útil.
A ausência de estado tem consequências reais. Cada conversa começa do zero. Volta a explicar a sua stack tecnológica, as suas convenções de programação, os objetivos do seu projeto, as suas preferências de comunicação. Se usa IA diariamente, gasta horas por mês a fornecer contexto que a IA já devia conhecer. Isso não é inteligência — é entrada de dados.
O custo vai mais fundo do que tempo desperdiçado. Sem memória, a IA não consegue construir uma compreensão progressiva. Não consegue reconhecer padrões entre conversas. Não consegue aprender com correções. Não consegue desenvolver um modelo preciso de quem é e do que precisa. Cada interação é igualmente superficial, independentemente de ser a primeira ou a milésima.
É por isto que a IA ainda parece uma ferramenta em vez de um colaborador. Um colega humano que esquecesse tudo todas as manhãs seria inútil. Esperamos o mesmo da IA — mas aceitámos um padrão muito mais baixo porque "é assim que os LLMs funcionam".
A OpenAI, a Anthropic e a Google lançaram todas funcionalidades de memória. São melhores do que nada. Mas não são a resposta.
O ChatGPT Memory armazena aproximadamente 1400 palavras no total em todas as suas conversas. Não há sistema de prioridade — o modelo decide o que recordar. Dois incidentes maiores de apagamento de memória em 2025 eliminaram meses de contexto acumulado para milhares de utilizadores. Não há exportação, não há pesquisa, não há organização estruturada.
O Claude Memory está limitado a projetos, o que é melhor para organização. Mas só funciona dentro do Claude. Se usa Cursor para programar, ChatGPT para escrever e Claude para análise, tem três sistemas de memória separados e incompatíveis sem forma de os unificar.
O Gemini Memory é semelhante — bloqueado ao ecossistema Google. O seu contexto acumulado desaparece no momento em que muda para uma ferramenta diferente.
O problema fundamental com a memória da plataforma é o vendor lock-in. As suas memórias pertencem à plataforma, não a si. Não as pode exportar, não as pode usar com outros modelos, e está a uma mudança de política de perder tudo.
A memória persistente não é "memória aparafusada num chatbot". É uma camada de conhecimento independente que se senta entre si e qualquer modelo de IA. Tem cinco características definidoras:
A diferença entre IA sem estado e IA com memória não é incremental — é categórica. Eis o que muda:
Fluxos de desenvolvimento — A sua IA conhece a sua stack, as suas convenções, a arquitetura do seu projeto e as suas decisões anteriores. Não sugere React quando usa Vue. Não propõe padrões que rejeitou explicitamente. Recorda porque é que escolheu PostgreSQL em vez de MongoDB há três meses.
Escrita e comunicação — A sua IA aprende a sua voz, o seu tom, a sua estrutura preferida. Produz rascunhos que soam como si, não como uma IA genérica. Recorda correções de estilo e aplica-as de forma consistente.
Investigação e análise — O contexto cresce ao longo de semanas. A sua IA recorda descobertas anteriores, segue hipóteses em evolução e liga nova informação a factos estabelecidos. A investigação torna-se cumulativa, não repetitiva.
Aprendizagem e educação — A sua IA adapta-se ao seu nível de conhecimento. Não explica os básicos que já compreende. Constrói sobre conversas anteriores, seguindo o seu progresso e ajustando a complexidade conforme necessário.
A memória persistente eficaz não é unidimensional. A Alma usa uma arquitetura em três camadas que reflecte a cognição humana:
Por cima destas três camadas senta-se o Soul Engine — um sistema de identidade estruturado que define como a IA deve pensar, comunicar e comportar-se. Não um único system prompt, mas blocos organizados para identidade, personalidade, especialização, regras e contexto que persistem e evoluem.
Estamos num ponto de inflexão. Nos últimos três anos, a indústria de IA focou-se em capacidades do modelo: mais parâmetros, janelas de contexto maiores, melhor raciocínio. Estas melhorias importam. Mas não resolvem o problema fundamental da ausência de estado. Um modelo com uma janela de contexto de 1 milhão de tokens continua a esquecer tudo quando a conversa termina.
A próxima onda de valor de IA virá de sistemas que acumulam inteligência ao longo do tempo. A memória é a base. Sem ela, cada interação de IA é um arranque a frio. Com ela, cada interação constrói sobre tudo o que veio antes.
É por isto que construímos a Alma. Não outro chatbot com uma funcionalidade de memória aparafusada. Uma camada de memória persistente independente que funciona em modelos, plataformas e ferramentas. Ver planos — chat completo, servidor MCP, SDK e acesso à API a partir de $14/mês.