Claude API ve Kalıcı Memory ile PM Ajanı Oluşturma

Mayıs 2026 · 11 dk okuma · Fran Olivares, OlivaresAI Kurucusu

Claude API ve Alma kalıcı memory üzerine kurulu bir proje yönetimi ajanı, günler ve haftalar boyunca bağlamı kaybetmeden paydaşları, kararları, SLA'ları ve stand-up notlarını izler. Mimarinin dört bölümü vardır: bir Claude konuşma döngüsü, proje varlığına göre anahtarlanmış bir memory deposu, her sohbetten yapılandırılmış kayıtlar çıkaran bir çıkarıcı ve her komutun doğru dilimini enjekte eden bir bağlam derleyici. Kalıcı memory, Claude'u akıllı bir taslak hazırlama aracından geçen Salı takımın ne karar verdiğini hatırlayan bir ajana dönüştüren şeydir.

Proje yönetimi çoğunlukla memory işidir. Bu akışın sahibi kim? Migrasyon penceresi hakkında ne anlaştık? Neden rate limiter'ı kapsam dışına aldık? Hukuki inceleme yayını ne zaman engelliyor? Bu soruları her sabah yeniden sormak zorunda kalan bir ajan ajan değil — biraz daha hızlı bir stajyer. Bunu değiştirme yolu, modele konuşmadan otomatik olarak doldurulan, sıralar arasında okuyup yazabileceği kalıcı bir memory katmanı vermektir. Bu rehber, LLM olarak Anthropic Claude API'sini ve memory katmanı olarak Alma'nın REST API'sini kullanarak referans mimari ve entegrasyon kodunu inceler.

Bir PM ajanı özellikle neden kalıcı memory'ye ihtiyaç duyar?

Üç yapısal neden. Birincisi, bir PM'nin izlediği varlıklar (insanlar, kararlar, teslim edilebilirler, SLA'lar, riskler) kendileri uzun ömürlüdür — tanım gereği herhangi bir tek konuşmadan daha uzun yaşarlar. İkincisi, konuşma üslubu yüksek frekanslı ve düşük efordur: kısa stand-up mesajları, hızlı açıklamalar, "X hakkında ne söyledik?" soruları. Doğru bağlam dilimini ucuza yüklemek önemlidir. Üçüncüsü, unutmanın maliyeti yüksektir: kaçırılan bir karar kaçırılan bir sürüm olur, unutulan bir bağımlılık bir engelleyici olur.

Durumsuz bir Claude konuşması tek bir planlama oturumunu iyi ele alır. Kullanıcı süreklilik istediği anda ("dün anlaştık…", "bu hafta auth takımını ne engelliyor?"), konuşmanın ya tam geçmişi bağlam penceresine yeniden oynatması (pahalı, sonunda imkânsız) ya da modelin dışında bir memory katmanına dayanması gerekir.

Referans mimari neye benziyor?

Dört hareketli parça:

Bir PM ajanı için memory kategorilerini nasıl yapılandırırım?

Beş kategori çoğu takımı kapsar: stakeholder (rol + sorumluluklarla insanlar), decision (ne anlaşıldı, ne zaman, kim tarafından, gerekçeyle), sla (diğer takımlara veya müşterilere taahhütler), risk (sahip + azaltma ile açık sorunlar), milestone (hedef tarih + kapsam + durum). Her memory bir önem puanı taşır; böylece derleyici geri çağırmada yüksek bahisli öğelere öncelik verebilir.

Kategori yalnızca organizasyon için değil — geri çağırma sinyalinin bir parçasıdır. Kullanıcı "ne karar verdik?" diye sorduğunda, derleyici karar kategorisi memories'lerini daha yüksek ağırlıklandırır. "Kim engellendi?" diye sorduklarında, risk kategorisi memories yükselir. Alma'nın bağlam derlemesi tam olarak bu kullanım senaryosu için kategori başına artırma ağırlıklarını açığa çıkarır.

Gerçek koddaki entegrasyon döngüsü nedir?

Kullanıcı mesajı başına üç aşama. Aşağıdaki sözde kod Node.js'i Alma SDK ve Anthropic SDK ile kullanır, ancak aynı şekil Python'da veya başka bir yığında çalışır:

Aşama 3 arka planda çalışır — kullanıcı akışlı yanıtı hemen görür ve çıkarım engellemeden sonraki ~1 s'de gerçekleşir. Yeni memories tekilleştirilir, mevcut girişlere karşı çelişkiler algılanır ve depo otomatik olarak temiz kalır. Tam SDK referansı: @olivaresai/alma-sdk; REST API belgelerinde HTTP eşdeğerleri.

Ajan çoklu proje izolasyonunu nasıl ele alır?

Alma environments kullanın: proje başına bir environment. Her environment'ın kendi memories, episodes, procedures ve Soul blokları vardır, diğerlerinden tamamen izole edilmiştir. Ajan her memory çağrısında environmentId iletir; API sınırı uygular. Çapraz proje sorguları açık bir environment geçişi olmadan kolayca mümkün değildir — bu, A projesinden B projesine kararların sızdırılmasının gerçek bir sorun olduğu bir PM aracı için doğru varsayılandır.

Takım çapında PM ajanları için (birden fazla insan aynı ajanla etkileşime girer), Alma teams kaynağını kullanın: her takımın tüm üyelere görünür paylaşılan memories'i ve kişisel tercihler için kullanıcı başına memories'i vardır. Rol tabanlı erişim kontrolleri, kimin ne yazabileceğini belirler.

Günlük bir stand-up sırası uçtan uca neye benziyor?

Kullanıcı mesajı: "stand-up: backend takımı, Maria bugün migrasyonu engellemekten kurtarıyor, José rate limiter üzerinde; GA sürümünü Cuma'ya itmeye karar verdik çünkü hukuki ekip DPA'yı hâlâ inceliyor". Ajanın akışı:

Akılda tutulması gereken yaygın iş akışları

Karar arkeolojisi. "Rate limiter'ı neden kapsam dışına aldık?" — ajan karar memory'sini artı çevreleyen episode ve başvurduğu risk memory'sini geri çağırır. Yanıtı kayıtlara atıflarla döndürür, böylece kullanıcı gerekirse konuşmaya derinlemesine inebilir.

Paydaş arama. "Migrasyona kim sahip?" — stakeholder kategorisine karşı doğrudan memory sorgusu, kaydı döndürür. Yanıt eskimişse (rol geçen hafta değiştiyse), çelişki algılama bunu yeni sahipten bahseden bir sonraki konuşmada yakalar.

Yinelenen rapor oluşturma. "Bu hafta auth akışı için bir durum raporu oluştur" — ajan o akış için etiketlenmiş episodes, kararlar ve risklerin bir bağlam penceresini derler, ardından raporu o kuratör dilimden taslakla. Bu, Claude'dan ham sohbet geçmişini özetlemesini istemekten önemli ölçüde daha ucuz ve daha doğrudur.

Sistem komutunu küçük tutarken hâlâ temellendirilmiş nasıl tutarım?

Derleyicideki varsayılan token bütçeleri: memories için ~2 K token, episodes için ~1 K, procedures için ~500, Soul blokları için ~500. Toplam ~4 K — herhangi bir modelin bağlam bütçesinin oldukça altında ve cache isabetleri konuşma boyunca amortize edilir. Projeniz küçükse (<100 aktif memory), bütçeyi daha da düşürebilirsiniz. Büyükse (10 K+ memory), derleyici ~4 K'da kalır çünkü depo büyük olsa bile geri çağırma dahil edilen kayıt sayısını sınırlar.

İki şey operasyonel olarak önemlidir: Soul blokları (ajanın kimliği) tekrarlanan çağrıların giriş token'larını yeniden ödememesi için kararlı bir sistem komutu öneki olarak cache'lenmelidir; ve dinamik bağlam (memories + episodes) cache kesme noktasından sonra oturmalıdır, böylece her çağrı yalnızca değişen kısmı yeniden yükler. Anthropic'in komut cache'leme belgeleri kesme noktası yerleşimini kapsar.

Bu pratikte ne kadara mal olur?

Tipik bir PM takım akışında (~20 mesaj/gün kullanıcı başına, çoğunlukla stand-up'lar + açıklamalar), marjinal maliyet LLM çağrılarının kendisiyle baskındır. Memory katmanı şunları ekler: bir derleme çağrısı (birkaç KB okuma + geri çağırma, ~30 ms), bir çıkarım çağrısı (Haiku, sıra başına ~$0.001). Aktif kullanıcı başına günlük toplam memory yükü: bir centin oldukça altında. PM takımının kararları kaybetmemesinin değerini karşılaştırın — ve matematik açıktır.

Prototipe nasıl başlarım?

Alma'nın Starter planı ($14/mo) giriş katmanıdır ve kalıcı memory katmanını içerir. alma.olivares.ai adresinden kaydolun, Ayarlar'da bir API anahtarı oluşturun ve geliştiriciler sayfasından SDK starter'ını klonlayın. Üç aşamalı döngüyü ajan kodunuza bağlayın, tek bir test projesine yönlendirin ve bir hafta boyunca çalıştırın. Depo konuşmalardan doğal olarak doldurulacak; manuel veri girişi olmadan kararların, paydaşların ve risklerin biriktiğini göreceksiniz. Oradan kategorileri arttırmak ve derleyiciyi ayarlamak meselesidir.

İlgili okuma: AI için Kalıcı Memory: Eksiksiz 2026 Rehberi · AI'ye Kalıcı Memory Nasıl Verilir · Üç Katmanlı Memory Mimarisi · Bağlam Derleme Belgeleri · Environments.

See plans