Nisan 2026 · 12 dk okuma · Fran Olivares, OlivaresAI Kurucusu
AI memory yönetimi, bir AI sisteminin zaman içinde biriktirdiği bilgiyi saklama, düzenleme, puanlama, geri çağırma ve süresini doldurma disiplinidir. 2026'da bu, tek kullanımlık chatbotlar gibi hissettiren AI araçları ile gerçek işbirlikçi olarak işleyen AI sistemleri arasındaki kritik ayrım haline geldi. Bu rehber her şeyi kapsar: temel mimari kararlardan puanlama algoritmaları ve bağlam derlemenin pratik ayrıntılarına kadar.
Memory yönetimi olmadan her AI konuşması izole bir olaydır. Kullanıcı aynı bağlamı defalarca açıklar. AI dün düzeltildiği aynı hataları tekrar yapar. Üç hafta önce alınan kararlar görünmezdir. Bu küçük bir rahatsızlık değil — herhangi bir sürdürülen iş akışında AI'nin yararlı olmasını engelleyen temel bir mimari başarısızlıktır.
Maliyet gerçektir: Deloitte tarafından yapılan bir çalışma, bilgi işçilerinin zamanlarının %20'sini zaten var olan bilgileri arayarak veya yeniden oluşturarak harcadığını tahmin etti. AI'nin memory'si yoksa bu yüzde iyileşmez, kötüleşir. Öğrendiği her şeyi unutan bir zekâya ödeme yapıyorsunuz.
Etkili memory yönetimi düz bir anahtar-değer deposundan fazlasını gerektirir. Alma, insan bilişinin gerçekte nasıl çalıştığını yansıtan üç katmanlı bir mimari kullanır:
Bunlar ayrık bilgi parçalarıdır: "Kullanıcı TypeScript'i JavaScript'e tercih ediyor," "Proje PostgreSQL 16 kullanıyor," "Müşteri son tarihi 15 Mart." Her memory üst veriye sahiptir — bir kategori, önem puanı (0.0 ila 1.0), güven seviyesi, kaynak konuşma ve semantik arama için bir vektör embedding. Memories temeldir. Şu soruyu yanıtlarlar: AI bu kullanıcı hakkında ne biliyor?
Episodes, önceki konuşmalarda olanların sıkıştırılmış kayıtlarıdır. Tam transkript değil — yapılandırılmış bir özet: ne tartışıldı, ne karar verildi, ne değişti. Episodes şu soruyu yanıtlar: zaman içinde ne oldu? Modele anlatı ve ilerleme hissi verirler.
Procedures, AI'nin tekrarlanan etkileşimlerden öğrendiği adım adım kalıplardır. "Kullanıcı dağıtım yapmasını istediğinde önce test paketini kontrol et, sonra migrasyonu çalıştır, sonra staging'e dağıt." Procedures şu soruyu yanıtlar: AI belirli durumlarda nasıl davranmalı?
Memories saklamak kolaydır. Doğru memories'i doğru zamanda çekmek zor olan problemdir. Alma beş ağırlıklı boyuta sahip çok faktörlü bir puanlama sistemi kullanır:
Ağırlıklar bilinçlidir. Alaka baskındır çünkü birincil hedef mevcut bağlam için doğru memory'yi bulmaktır. Yenilik bilinçli olarak düşüktür — üç ay önceki bir gerçek hâlâ bir gerçektir. Bu, AI sistemlerinin sırf yeni olduğu için yeni bilgiye öncelik verdiği "yenilik yanlılığı" problemini önler.
Geri çağırma olmadan memory bir veritabanıdır, zekâ değil. Bağlam derleme, saklanan memories'i kullanışlı bir sistem komutuna dönüştüren süreçtir. Alma'da bu 100 ms'nin altında gerçekleşir:
Memories varsayılan olarak kalıcı değildir. Alma tam bir yaşam döngüsü uygular:
Bu yaşam döngüsü, AI sistemlerinin geri çağırma kalitesini bozan binlerce düşük değerli memory biriktirdiği "memory şişmesi" sorununu önler.
Kendi AI memory sisteminizi oluşturuyorsanız, en önemli mimari kararlar şunlardır:
Veya altyapı işini tamamen atlayın: Alma tüm bunları kutudan çıkar çıkmaz sağlar. Kalıcı memory'yi kendi araçlarına entegre etmek isteyen geliştiriciler için tamREST API, MCP sunucusu ve JavaScript SDK.