Bir PM ajanı neden kalıcı memory'ye ihtiyaç duyar?

Bir PM ajanı, tek bir konuşmadan daha uzun yaşayan paydaşları, kararları, SLA'ları ve riskleri izler. Kalıcı memory olmadan ajan her gün aynı soruları yeniden sorar. Onunla ajan takımın geçen Salı ne anlaştığını hatırlar ve takip sorularını yeni oturumlar yerine devamlar olarak ele alır.

Ajan kararları otomatik olarak nasıl yakalar?

Her konuşma sırasından sonra, bir çıkarıcı (Claude Haiku) son mesajları okur ve yeni memories önerir: paydaşlar, kararlar, riskler, kilometre taşları, SLA'lar. Yeni girişler mevcut depoya karşı tekilleştirilir; çelişkiler üst üste binmeyi tetikler. Kullanıcı hiçbir şeyi elle günlüğe kaydetmez.

Birden fazla projeyi nasıl izole tutarım?

Alma environments kullanın: proje başına bir environment. Her environment'ın kendi memories, episodes, procedures ve Soul blokları vardır. Çapraz proje sorguları açık bir geçiş olmadan mümkün değildir, bu projeler arasında kararları sızdırmanın gerçek bir risk olduğu bir PM aracı için güvenli varsayılandır.

Tipik bir takımda bu ne kadara mal olur?

Kullanıcı başına marjinal maliyet LLM çağrılarının kendisiyle baskındır. Memory katmanı sıra başına bir ucuz derleme çağrısı (~30 ms, birkaç KB) ve bir Haiku çıkarım çağrısı ekler. Kullanıcı başına günde 20 mesaj çalıştıran bir takım için memory yükü günde bir centin oldukça altındadır.

Claude API ve Kalıcı Memory ile PM Ajanı Oluşturma

Mayıs 2026 · 11 dk okuma · Fran Olivares, OlivaresAI Kurucusu

Claude API ve Alma kalıcı memory üzerine kurulu bir proje yönetimi ajanı, günler ve haftalar boyunca bağlamı kaybetmeden paydaşları, kararları, SLA'ları ve stand-up notlarını izler. Mimarinin dört bölümü vardır: bir Claude konuşma döngüsü, proje varlığına göre anahtarlanmış bir memory deposu, her sohbetten yapılandırılmış kayıtlar çıkaran bir çıkarıcı ve her komutun doğru dilimini enjekte eden bir bağlam derleyici. Kalıcı memory, Claude'u akıllı bir taslak hazırlama aracından geçen Salı takımın ne karar verdiğini hatırlayan bir ajana dönüştüren şeydir.

Proje yönetimi çoğunlukla memory işidir. Bu akışın sahibi kim? Migrasyon penceresi hakkında ne anlaştık? Neden rate limiter'ı kapsam dışına aldık? Hukuki inceleme yayını ne zaman engelliyor? Bu soruları her sabah yeniden sormak zorunda kalan bir ajan ajan değil — biraz daha hızlı bir stajyer. Bunu değiştirme yolu, modele konuşmadan otomatik olarak doldurulan, sıralar arasında okuyup yazabileceği kalıcı bir memory katmanı vermektir. Bu rehber, LLM olarak Anthropic Claude API'sini ve memory katmanı olarak Alma'nın REST API'sini kullanarak referans mimari ve entegrasyon kodunu inceler.

Bir PM ajanı özellikle neden kalıcı memory'ye ihtiyaç duyar?

Üç yapısal neden. Birincisi, bir PM'nin izlediği varlıklar (insanlar, kararlar, teslim edilebilirler, SLA'lar, riskler) kendileri uzun ömürlüdür — tanım gereği herhangi bir tek konuşmadan daha uzun yaşarlar. İkincisi, konuşma üslubu yüksek frekanslı ve düşük efordur: kısa stand-up mesajları, hızlı açıklamalar, "X hakkında ne söyledik?" soruları. Doğru bağlam dilimini ucuza yüklemek önemlidir. Üçüncüsü, unutmanın maliyeti yüksektir: kaçırılan bir karar kaçırılan bir sürüm olur, unutulan bir bağımlılık bir engelleyici olur.

Durumsuz bir Claude konuşması tek bir planlama oturumunu iyi ele alır. Kullanıcı süreklilik istediği anda ("dün anlaştık…", "bu hafta auth takımını ne engelliyor?"), konuşmanın ya tam geçmişi bağlam penceresine yeniden oynatması (pahalı, sonunda imkânsız) ya da modelin dışında bir memory katmanına dayanması gerekir.

Referans mimari neye benziyor?

Dört hareketli parça:

Claude API konuşma döngüsü. Anthropic SDK'sından proje farkındalıklı bir sistem komutuyla standart bir messages.create akışı. Model gerektiğinde memory katmanından varlıkları adıyla isteyebilsin diye araç kullanımı etkindir.
Proje varlığına göre anahtarlanmış memory deposu. Her paydaş, teslim edilebilir, karar ve SLA bir kategori etiketi (stakeholder, decision, sla, risk) ve bir önem puanı olan bir memory kaydıdır. Episodes sıkıştırılmış günlük stand-up'ları yakalar; procedures yinelenen iş akışlarını ("hotfix'leri ele alma şeklimiz") yakalar.
Otomatik çıkarıcı. Her konuşma sırasından sonra, küçük bir Claude Haiku çağrısı son mesajları okur ve yeni memories (veya mevcut olanlarda güncellemeler) önerir. Bu, ajanı düşük sürtünmeli yapan şeydir: kullanıcı kararları elle günlüğe kaydetmez; ajan onlar için yapar.
Bağlam derleyici. Her kullanıcı sırasından önce, kullanıcı sorgusu verildiğinde en alakalı girişler için memory API'sine sorulur. Sonuç Claude sistem komutunun bir parçası olur — bunu bu belirli soru için kuratör bir kopya kâğıdı olarak düşünün.

Bir PM ajanı için memory kategorilerini nasıl yapılandırırım?

Beş kategori çoğu takımı kapsar: stakeholder (rol + sorumluluklarla insanlar), decision (ne anlaşıldı, ne zaman, kim tarafından, gerekçeyle), sla (diğer takımlara veya müşterilere taahhütler), risk (sahip + azaltma ile açık sorunlar), milestone (hedef tarih + kapsam + durum). Her memory bir önem puanı taşır; böylece derleyici geri çağırmada yüksek bahisli öğelere öncelik verebilir.

Kategori yalnızca organizasyon için değil — geri çağırma sinyalinin bir parçasıdır. Kullanıcı "ne karar verdik?" diye sorduğunda, derleyici karar kategorisi memories'lerini daha yüksek ağırlıklandırır. "Kim engellendi?" diye sorduklarında, risk kategorisi memories yükselir. Alma'nın bağlam derlemesi tam olarak bu kullanım senaryosu için kategori başına artırma ağırlıklarını açığa çıkarır.

Gerçek koddaki entegrasyon döngüsü nedir?

Kullanıcı mesajı başına üç aşama. Aşağıdaki sözde kod Node.js'i Alma SDK ve Anthropic SDK ile kullanır, ancak aynı şekil Python'da veya başka bir yığında çalışır:

Aşama 1 — bağlam derle. const { systemPrompt } = await alma.context.assemble({ query: userMessage, environmentId: projectId });
Aşama 2 — Claude'u çağır. const stream = anthropic.messages.stream({ model: 'claude-opus-4-7', system: systemPrompt, messages: [{ role: 'user', content: userMessage }] });
Aşama 3 — memories çıkar. Akış tamamlandıktan sonra, await alma.memories.extract({ text: lastTurn, environmentId: projectId });

Aşama 3 arka planda çalışır — kullanıcı akışlı yanıtı hemen görür ve çıkarım engellemeden sonraki ~1 s'de gerçekleşir. Yeni memories tekilleştirilir, mevcut girişlere karşı çelişkiler algılanır ve depo otomatik olarak temiz kalır. Tam SDK referansı: @olivaresai/alma-sdk; REST API belgelerinde HTTP eşdeğerleri.

Ajan çoklu proje izolasyonunu nasıl ele alır?

Alma environments kullanın: proje başına bir environment. Her environment'ın kendi memories, episodes, procedures ve Soul blokları vardır, diğerlerinden tamamen izole edilmiştir. Ajan her memory çağrısında environmentId iletir; API sınırı uygular. Çapraz proje sorguları açık bir environment geçişi olmadan kolayca mümkün değildir — bu, A projesinden B projesine kararların sızdırılmasının gerçek bir sorun olduğu bir PM aracı için doğru varsayılandır.

Takım çapında PM ajanları için (birden fazla insan aynı ajanla etkileşime girer), Alma teams kaynağını kullanın: her takımın tüm üyelere görünür paylaşılan memories'i ve kişisel tercihler için kullanıcı başına memories'i vardır. Rol tabanlı erişim kontrolleri, kimin ne yazabileceğini belirler.

Günlük bir stand-up sırası uçtan uca neye benziyor?

Kullanıcı mesajı: "stand-up: backend takımı, Maria bugün migrasyonu engellemekten kurtarıyor, José rate limiter üzerinde; GA sürümünü Cuma'ya itmeye karar verdik çünkü hukuki ekip DPA'yı hâlâ inceliyor". Ajanın akışı:

Bağlam derle: derleyici ilgili bağlamı döndürür — önceki stand-up episode'u, GA sürümü hakkında karar memory'si, Maria ve José için paydaş kayıtları, hukuki inceleme hakkında risk memory'si.
Claude yanıtlar: "Güncellenmiş stand-up günlüğe kaydedildi. Maria → migrasyon engelleyici kaldırma; José → rate limiter; GA sürümü hukuki DPA incelemesi beklenirken Cuma'ya taşındı. Risk #4 (hukuki inceleme) durumu, sahip siz olarak açık kalır."
Çıkarıcı çalışır: yeni bir episode stand-up'ı özetler, GA-sürümü karar memory'si yeni tarihle güncellenir, hukuki-inceleme risk memory'sinin son dokunulan zaman damgası yenilenir (böylece azalmaz) ve bir procedure memory "GA kayarsa, karar günlüğe kaydet + riski güncelle" iş akışını yakalar.

Akılda tutulması gereken yaygın iş akışları

Karar arkeolojisi. "Rate limiter'ı neden kapsam dışına aldık?" — ajan karar memory'sini artı çevreleyen episode ve başvurduğu risk memory'sini geri çağırır. Yanıtı kayıtlara atıflarla döndürür, böylece kullanıcı gerekirse konuşmaya derinlemesine inebilir.

Paydaş arama. "Migrasyona kim sahip?" — stakeholder kategorisine karşı doğrudan memory sorgusu, kaydı döndürür. Yanıt eskimişse (rol geçen hafta değiştiyse), çelişki algılama bunu yeni sahipten bahseden bir sonraki konuşmada yakalar.

Yinelenen rapor oluşturma. "Bu hafta auth akışı için bir durum raporu oluştur" — ajan o akış için etiketlenmiş episodes, kararlar ve risklerin bir bağlam penceresini derler, ardından raporu o kuratör dilimden taslakla. Bu, Claude'dan ham sohbet geçmişini özetlemesini istemekten önemli ölçüde daha ucuz ve daha doğrudur.

Sistem komutunu küçük tutarken hâlâ temellendirilmiş nasıl tutarım?

Derleyicideki varsayılan token bütçeleri: memories için ~2 K token, episodes için ~1 K, procedures için ~500, Soul blokları için ~500. Toplam ~4 K — herhangi bir modelin bağlam bütçesinin oldukça altında ve cache isabetleri konuşma boyunca amortize edilir. Projeniz küçükse (<100 aktif memory), bütçeyi daha da düşürebilirsiniz. Büyükse (10 K+ memory), derleyici ~4 K'da kalır çünkü depo büyük olsa bile geri çağırma dahil edilen kayıt sayısını sınırlar.

İki şey operasyonel olarak önemlidir: Soul blokları (ajanın kimliği) tekrarlanan çağrıların giriş token'larını yeniden ödememesi için kararlı bir sistem komutu öneki olarak cache'lenmelidir; ve dinamik bağlam (memories + episodes) cache kesme noktasından sonra oturmalıdır, böylece her çağrı yalnızca değişen kısmı yeniden yükler. Anthropic'in komut cache'leme belgeleri kesme noktası yerleşimini kapsar.

Bu pratikte ne kadara mal olur?

Tipik bir PM takım akışında (~20 mesaj/gün kullanıcı başına, çoğunlukla stand-up'lar + açıklamalar), marjinal maliyet LLM çağrılarının kendisiyle baskındır. Memory katmanı şunları ekler: bir derleme çağrısı (birkaç KB okuma + geri çağırma, ~30 ms), bir çıkarım çağrısı (Haiku, sıra başına ~$0.001). Aktif kullanıcı başına günlük toplam memory yükü: bir centin oldukça altında. PM takımının kararları kaybetmemesinin değerini karşılaştırın — ve matematik açıktır.

Prototipe nasıl başlarım?

Alma'nın Starter planı ($14/mo) giriş katmanıdır ve kalıcı memory katmanını içerir. alma.olivares.ai adresinden kaydolun, Ayarlar'da bir API anahtarı oluşturun ve geliştiriciler sayfasından SDK starter'ını klonlayın. Üç aşamalı döngüyü ajan kodunuza bağlayın, tek bir test projesine yönlendirin ve bir hafta boyunca çalıştırın. Depo konuşmalardan doğal olarak doldurulacak; manuel veri girişi olmadan kararların, paydaşların ve risklerin biriktiğini göreceksiniz. Oradan kategorileri arttırmak ve derleyiciyi ayarlamak meselesidir.

İlgili okuma: AI için Kalıcı Memory: Eksiksiz 2026 Rehberi · AI'ye Kalıcı Memory Nasıl Verilir · Üç Katmanlı Memory Mimarisi · Bağlam Derleme Belgeleri · Environments.

See plans