Nisan 2026 · 11 dk okuma · Fran Olivares, OlivaresAI Kurucusu
Çoğu AI asistanı durumsuzdur. Bir komut işler, bir yanıt üretir ve her şeyi unutur. AI kullanan bir ürün oluşturuyorsanız — bir kodlama aracı, bir müşteri destek botu, bir araştırma asistanı, kişisel bir öğretmen — bu durumsuzluk en büyük sınırlamanızdır. Kullanıcılarınız aynı soruları soracak, aynı bağlamı sağlayacak ve AI bariz bir şeyi hatırlayamadığı her seferinde güvenlerini kaybedecektir. Bu makale, kalıcı memory'yi birinci sınıf bir mimari bileşen olarak kullanarak gerçekten hatırlayan AI asistanlarının nasıl oluşturulacağını anlatır.
Geliştiriciler bir AI asistanına ilk kez memory eklemeyi denediklerinde genellikle iki yaklaşımdan birine başvurur: her şeyi sistem komutuna yığmak veya bir RAG (Retrieval-Augmented Generation) işlem hattı kurmak. Her ikisinin de ciddi sınırlamaları vardır.
Sistem komutu yaklaşımı ölçekte başarısız olur. Bağlam pencereleri sonludur — 200K token ile bile her ilgili gerçek, konuşma ve tercihi dahil edemezsiniz. Ve sistem komutundaki her token için her tek istekte ödeme yaparsınız.
RAG daha iyidir ama eksiktir. Belgelerin geri çağrılmasını çözer ama AI memory'nin tam yaşam döngüsünü (çıkarım, puanlama, tekilleştirme, birleştirme ve süre dolumu) ele almaz. RAG metin parçalarını geri çağırır. Memory gerçekleri, tercihleri, kararları ve davranışsal kalıpları anlar. Bunlar temelde farklı problemlerdir. (Ayrıntılı karşılaştırmamıza bakın: Kalıcı Memory ile RAG karşılaştırması.)
Kalıcı memory'li gerçekten yararlı bir AI asistanı beş yeteneğe ihtiyaç duyar:
Bir AI asistanına kalıcı memory eklemenin en hızlı yolu Model Context Protocol (MCP) aracılığıyladır. Asistanınız Claude Desktop, Cursor, Windsurf veya herhangi bir MCP uyumlu istemcide çalışıyorsa, 5 dakikadan kısa sürede memory ekleyebilirsiniz.
Sunucuyu küresel olarak yükleyin: npm install -g @olivaresai/alma-mcp. Ardından MCP istemci yapılandırmanıza API anahtarınızla ekleyin. Sunucu alma_remember (bir memory kaydet), alma_recall (memories ara), alma_assemble (tam bağlam oluştur) ve alma_extract (metinden memories çıkar) dahil 35 aracı sunar.
Bağlandıktan sonra, AI asistanı otomatik olarak kalıcı memory'ye erişir. Konuşmalar sırasında önemli gerçekleri kaydedebilir ve gelecekteki oturumlarda geri çağırabilir. Memory Alma'da sunucu tarafında saklanır — AI modelinden, istemciden veya konuşmadan bağımsızdır.
Özel uygulamalar için JavaScript SDK (@olivaresai/alma-sdk) tam programatik denetim sağlar. Tipik entegrasyon örüntüsü şöyle görünür:
client.context.assemble({ query: userMessage }) çağırın.client.memories.extract({ text: conversation }) çağırın.Bu örüntü herhangi bir LLM sağlayıcısıyla çalışır. Memory katmanınız modelden ayrılmıştır — Claude'dan GPT-4'e tek bir memory kaybetmeden geçin.
REST API, herhangi bir dilden veya platformdan eksiksiz memory yönetimi için 140+ uç nokta sağlar. Memory destekli bir asistan oluşturmak için ana uç noktalar:
POST /api/v1/context/assemble — Memories, episodes, procedures ve soul bloklarından bağlam derler.POST /api/v1/memories — İçerik, kategori, önem ve güvenle bir memory oluşturur.GET /api/v1/memories/search?q=query&mode=hybrid — Memories'i anahtar kelime, semantik benzerlik veya ikisiyle arar.POST /api/v1/memories/extract — LLM analizi kullanarak metinden memories çıkarır.POST /api/v1/blocks — AI kimliği ve kişiliği için soul bloklarını yapılandırır.Memory tek başına yeterli değildir. Gerçekleri hatırlayan ama tutarlı kişiliği olmayan bir AI asistanı mekanik hissettirir. Alma'nın Soul Engine'i yapılandırılmış kimlik blokları sağlar — gömülen tek bir sistem komutu değil, kimlik, kişilik, uzmanlık, iletişim üslubu, kurallar ve bağlam için düzenli bölümler. Bu bloklar sürümlüdür, her zaman öncelikle enjekte edilir ve environment başına yapılandırılabilir.
Örneğin: AI'nin "iş" environment'ınızda özlü ve teknik olması gerektiğini, ancak "öğrenme" environment'ınızda sohbet edici ve açıklayıcı olması gerektiğini tanımlayabilirsiniz. Aynı memories, farklı kişilik. Genel bir chatbot yerine bir AI asistanını gerçek bir işbirlikçi gibi hissettiren şey budur.
Memory destekli asistanlar oluştururken yapılan yaygın hatalar:
En hızlı yol: alma.olivares.ai adresinden kaydolun, Ayarlar'dan bir API anahtarı alın ve MCP, SDK veya REST API aracılığıyla bağlanın. Starter planı ($14/mo) tam API erişimi içerir — ölçeklendirmeden önce prototip oluşturmak ve doğrulamak için yeterli.