AI memory yönetimi nedir?

Bir AI sisteminin zaman içinde biriktirdiği bilgiyi saklama, düzenleme, puanlama, geri çağırma ve süresini doldurma disiplinidir. Her konuşmayı unutan bir sohbet aracını her etkileşimden öğrenen bir AI işbirlikçisinden ayıran şeydir.

Neden üç katman (memories, episodes, procedures)?

Gerçekler, olaylar ve iş akışları farklı soruları yanıtlar. Bunları karıştırmak daha kötü geri çağırma üretir. Memories ayrık gerçekleri ve tercihleri saklar, episodes konuşma özetlerini saklar, procedures öğrenilmiş iş akışlarını saklar. Her katmanın kendi geri çağırma ve yaşam döngüsü kuralları vardır.

Puanlama neyin geri çağrılacağına nasıl karar verir?

Beş ağırlıklı faktör: alaka (50%, semantik + anahtar kelime eşleşmesi), önem (15%), güven (15%), yenilik (10%), sıklık (10%). Alaka baskındır, böylece doğru memory en yeni olanı yener — bu yenilik yanlılığı tuzağını önler.

Memory yaşam döngüsü nedir?

Çıkarım (her 4 mesajda, 0–30 memory), tekilleştirme (Jaccard 60% + 3 paylaşılan anahtar kelime), birleştirme (en yüksek güveni koruyarak yakın yinelenenleri birleştir) ve süre dolumu (önem < 0.1 ve 120 gün kullanılmamış). Bu, geri çağırma kalitesini bozan memory şişmesini önler.

AI Memory Yönetimi: Eksiksiz 2026 Rehberi

Nisan 2026 · 12 dk okuma · Fran Olivares, OlivaresAI Kurucusu

AI memory yönetimi, bir AI sisteminin zaman içinde biriktirdiği bilgiyi saklama, düzenleme, puanlama, geri çağırma ve süresini doldurma disiplinidir. 2026'da bu, tek kullanımlık bir chatbot ile gerçek bir işbirlikçi arasındaki farktır. Örüntü, üç katmanlı bir mimari (memories / episodes / procedures) artı beş faktörlü puanlama (alaka 50% / önem 15% / güven 15% / yenilik 10% / sıklık 10%) artı tam bir yaşam döngüsüdür (çıkar → tekilleştir → birleştir → süresini doldur).

AI memory yönetimi, bir AI sisteminin zaman içinde biriktirdiği bilgiyi saklama, düzenleme, puanlama, geri çağırma ve süresini doldurma disiplinidir. 2026'da bu, tek kullanımlık chatbotlar gibi hissettiren AI araçları ile gerçek işbirlikçi olarak işleyen AI sistemleri arasındaki kritik ayrım haline geldi. Bu rehber her şeyi kapsar: temel mimari kararlardan puanlama algoritmaları ve bağlam derlemenin pratik ayrıntılarına kadar.

AI memory yönetimi neden önemlidir?

Memory yönetimi olmadan her AI konuşması izole bir olaydır. Kullanıcı aynı bağlamı defalarca açıklar. AI dün düzeltildiği aynı hataları tekrar yapar. Üç hafta önce alınan kararlar görünmezdir. Bu küçük bir rahatsızlık değil — herhangi bir sürdürülen iş akışında AI'nin yararlı olmasını engelleyen temel bir mimari başarısızlıktır.

Maliyet gerçektir: Deloitte tarafından yapılan bir çalışma, bilgi işçilerinin zamanlarının %20'sini zaten var olan bilgileri arayarak veya yeniden oluşturarak harcadığını tahmin etti. AI'nin memory'si yoksa bu yüzde iyileşmez, kötüleşir. Öğrendiği her şeyi unutan bir zekâya ödeme yapıyorsunuz.

AI memory'nin üç katmanı nedir?

Etkili memory yönetimi düz bir anahtar-değer deposundan fazlasını gerektirir. Alma, insan bilişinin gerçekte nasıl çalıştığını yansıtan üç katmanlı bir mimari kullanır:

1. Semantik Memories (Gerçekler ve Tercihler)

Bunlar ayrık bilgi parçalarıdır: "Kullanıcı TypeScript'i JavaScript'e tercih ediyor," "Proje PostgreSQL 16 kullanıyor," "Müşteri son tarihi 15 Mart." Her memory üst veriye sahiptir — bir kategori, önem puanı (0.0 ila 1.0), güven seviyesi, kaynak konuşma ve semantik arama için bir vektör embedding. Memories temeldir. Şu soruyu yanıtlarlar: AI bu kullanıcı hakkında ne biliyor?

2. Episodes (Konuşma Özetleri)

Episodes, önceki konuşmalarda olanların sıkıştırılmış kayıtlarıdır. Tam transkript değil — yapılandırılmış bir özet: ne tartışıldı, ne karar verildi, ne değişti. Episodes şu soruyu yanıtlar: zaman içinde ne oldu? Modele anlatı ve ilerleme hissi verirler.

3. Procedures (Öğrenilmiş İş Akışları)

Procedures, AI'nin tekrarlanan etkileşimlerden öğrendiği adım adım kalıplardır. "Kullanıcı dağıtım yapmasını istediğinde önce test paketini kontrol et, sonra migrasyonu çalıştır, sonra staging'e dağıt." Procedures şu soruyu yanıtlar: AI belirli durumlarda nasıl davranmalı?

AI memory puanlaması ne çekileceğine nasıl karar verir?

Memories saklamak kolaydır. Doğru memories'i doğru zamanda çekmek zor olan problemdir. Alma beş ağırlıklı boyuta sahip çok faktörlü bir puanlama sistemi kullanır:

Alaka (50%) — Bu memory mevcut konuşmaya semantik olarak ne kadar yakın? Vektör embedding'ler arasındaki kosinüs benzerliğiyle ölçülür.
Önem (15%) — Bu memory ne kadar kritik? Kullanıcı tarafından beyan edilen gerçekler çıkarsanmış gözlemlerden daha yüksek puan alır.
Güven (15%) — Kaynak ne kadar güvenilir? Doğrudan kullanıcı ifadeleri 1.0, LLM çıkarımları 0.7, gözlemlenen örüntüler 0.5 alır.
Yenilik (10%) — Bu memory ne kadar yakın zamanda oluşturuldu veya erişildi? Üstel azalma, eski bilginin baskın olmasını önler.
Sıklık (10%) — Bu memory ne sıklıkla başvurulur? Sık kullanılan memories güçlendirilir.

Ağırlıklar bilinçlidir. Alaka baskındır çünkü birincil hedef mevcut bağlam için doğru memory'yi bulmaktır. Yenilik bilinçli olarak düşüktür — üç ay önceki bir gerçek hâlâ bir gerçektir. Bu, AI sistemlerinin sırf yeni olduğu için yeni bilgiye öncelik verdiği "yenilik yanlılığı" problemini önler.

Bağlam derleme memory'yi bir sistem komutuna nasıl dönüştürür?

Geri çağırma olmadan memory bir veritabanıdır, zekâ değil. Bağlam derleme, saklanan memories'i kullanışlı bir sistem komutuna dönüştüren süreçtir. Alma'da bu 100 ms'nin altında gerçekleşir:

Sorgu genişletme — Kullanıcının mesajı embed edilir ve üç memory katmanını paralel olarak aramak için kullanılır.
Aday geri çağırma — Vectorize'dan (semantik arama) artı anahtar kelime eşleşmelerinden en fazla 100 aday.
Puanlama ve sıralama — Çok faktörlü puanlama sistemi tüm adayları sıralar.
Token bütçesi — En üst sıradaki memories, episodes ve procedures kullanıcının planı için token bütçesi içinde seçilir.
Komut oluşturma — Soul blokları (kimlik, kişilik, kurallar) öncelik alır, ardından memories, sonra episodes, sonra procedures gelir.

AI memory yaşam döngüsü nasıl yönetilir?

Memories varsayılan olarak kalıcı değildir. Alma tam bir yaşam döngüsü uygular:

Çıkarım — Her 4 mesajdan sonra, arka plan işlemcisi Claude Haiku kullanarak konuşmadan 0-30 memory çıkarır.
Tekilleştirme — Yeni memories Jaccard benzerliği kullanılarak mevcut olanlara karşı kontrol edilir (%60 eşik ile 3+ paylaşılan anahtar kelime).
Birleştirme — Yinelenen ve neredeyse yinelenen memories en yüksek güveni ve en yeni kaynağı koruyarak birleştirilir.
Süre dolumu — Önemi 0.1 altında olan ve 120 gündür erişilmeyen memories süre dolumu için adaylardır.

Bu yaşam döngüsü, AI sistemlerinin geri çağırma kalitesini bozan binlerce düşük değerli memory biriktirdiği "memory şişmesi" sorununu önler.

Kendi AI memory sistemimi nasıl mimari etmeliyim?

Kendi AI memory sisteminizi oluşturuyorsanız, en önemli mimari kararlar şunlardır:

Depolamayı geri çağırmadan ayırın — Vektör veritabanınız memory sisteminiz değildir. Bunun üstüne puanlama, yaşam döngüsü yönetimi ve bağlam derleme gerekir.
Hibrit arama kullanın — Saf semantik arama tam eşleşmeleri kaçırır. Saf anahtar kelime araması kavramsal bağlantıları kaçırır. İkisini birleştirin.
Bağlam pencerenizi bütçeleyin — AI'nin bildiği her şeyi enjekte etmek, hiçbir şey enjekte etmemekten daha kötüdür. Acımasızca öncelik verin.
Memories'i düzenlenebilir yapın — Kullanıcıların AI'nin bildiklerini düzeltmesi, silmesi ve yeniden düzenlemesi gerekir. Bir kara kutu memory sistemi bir güven yüküdür.

Veya altyapı işini tamamen atlayın: Alma tüm bunları kutudan çıkar çıkmaz sağlar. Kalıcı memory'yi kendi araçlarına entegre etmek isteyen geliştiriciler için tamREST API, MCP sunucusu ve JavaScript SDK.

See plans