2026년 5월 업데이트
Zep은 AI 에이전트를 위한 장기 메모리 백엔드입니다. 핵심 차별 요소는 시간적 지식 그래프입니다: 대화가 흘러들어오면 Zep은 엔티티(사람, 프로젝트, 제품, 개념)를 자동으로 추출하고, 시간이 지남에 따라 속성을 추적하며, 에이전트가 "Y 날짜에 X에 대해 무엇을 알았나" 또는 "X에 대해 그때와 지금 사이에 무엇이 바뀌었나"를 쿼리할 수 있게 합니다. Graphiti 그래프 엔진이 이를 구동합니다; SDK와 관리형 클라우드 제품이 이를 래핑합니다.
Zep은 규모에서 AI 에이전트를 구축하는 엔지니어링 팀을 위해 위치하고 있습니다 — 일반적으로 AI가 복잡한 다중 턴 상호작용을 처리하고 팀이 평면 벡터 검색보다 타입 그래프 추론을 가치 있게 여기는 B2B SaaS 제품. 가격은 주로 엔터프라이즈 / 맞춤; 셀프 호스팅을 위한 오픈 소스 커뮤니티 에디션이 존재합니다.
Alma는 완전한 영속 메모리 제품입니다. 최종 사용자는 alma.olivares.ai에서 가입하고 Anthropic Claude(Haiku, Sonnet, 1M 토큰 컨텍스트의 Opus 4.7)와 채팅하며 메모리 레이어는 사실, 선호도, 결정을 자동으로 캡처합니다. Soul Engine은 AI 정체성을 처리합니다. Image, Video, Music, Code 스튜디오가 Pro와 Max에 번들로 제공됩니다. 개발자도 Max 플랜에서 MCP 서버, JavaScript SDK, REST API를 사용할 수 있습니다.
메모리는 5요소 스코어링이 있는 세 가지 레이어(memories, episodes, procedures)로 구조화됩니다. 유료 플랜은 전체 Soul Engine 액세스가 있는 $14/월(Starter)부터 시작합니다.
Zep의 시간적 지식 그래프가 가장 강력한 기능입니다. 엔티티는 일급 시민입니다; "프로젝트 X는 무엇인가?", "프로젝트 X에서 누가 일하나?", "마감일이 언제 변경되었나?"를 물으면 Zep은 그래프를 순회하여 답합니다. AI가 많은 엔티티 전반에 걸친 관계와 시간이 지남에 따라 어떻게 진화하는지에 대해 추론해야 할 때 진정으로 강력합니다 — 일반적인 고객 지원 AI, 리서치 에이전트, B2B 워크플로 자동화.
Alma의 3-레이어 모델은 모양에 대해 의견이 있습니다: memories(사실과 선호도), episodes(대화 요약), procedures(학습된 워크플로). 엔티티 추출은 모든 메모리 생성에서 휴리스틱하게 실행되며(읽기 시 추가 LLM 비용 없음) 내부 지식 그래프를 공급하지만, 사용자 대상 모델은 그래프 자체가 아닌 세 레이어입니다. 검색은 5요소 스코어링이 있는 하이브리드(시맨틱 + 키워드)입니다. 트레이드오프: 명시적인 그래프 추론은 덜하지만, 훨씬 단순한 정신 모델과 학습할 그래프 쿼리 언어 없이 100ms 이내에 작동하는 조립된 프롬프트.
Zep은 인프라입니다: 엔지니어링 팀이 자체 AI 제품에 통합합니다. 대부분의 사용자는 Zep의 이름을 결코 보지 못합니다; 그들은 그들을 기억하는 사용자의 제품을 봅니다. Alma는 제품입니다: 최종 사용자가 직접 가입하고, Alma 브랜드가 경험이며, 개발자는 SDK와 MCP 서버가 제공하는 추가 청중입니다.
팀이 정교한 다중 엔티티 추론이 중심에 있는 AI 에이전트를 구축하고 있다면 Zep은 정확히 그것을 위해 설계되었습니다. (사용자 또는 사용자의 팀이) 이미 작업하는 도구 — Cursor, Claude Desktop, VSCode — 에서 메모리가 있는 AI를 사용하고 싶다면 Alma는 통합 코드 작성 없이 그것을 커버합니다.
| 기능 | Zep | Alma |
|---|---|---|
| 대상 사용자 | AI 에이전트를 구축하는 개발자 / 엔지니어링 팀 | 최종 사용자 + 개발자 |
| 메모리 모델 | 엔티티 추출이 있는 시간적 지식 그래프(Graphiti) | 내부 엔티티 그래프가 있는 3-레이어(memories + episodes + procedures) |
| 웹 앱 / 채팅 | 없음 — API와 관리자 대시보드만 | 예 — 스트리밍, 도구, 파일 첨부가 있는 완전한 채팅 |
| AI 정체성 | 제공되지 않음 — 자체 사용 | Soul Engine(13개 버전 관리된 정체성 블록) |
| 시간적 인식 | 일급 — 시간 전반의 엔티티 변경 추적 | Episodes + 메모리 타임스탬프 + 중요도 감쇠(그래프 쿼리 언어 없음) |
| 컨텍스트 조립 | 자체 사용 — 그래프 쿼리가 데이터를 반환하고, 사용자가 프롬프트를 구축 | 내장 — 조립된 시스템 프롬프트 <100ms, 5요소 스코어링 |
| 통합 | SDK, REST API, 프레임워크 어댑터 | MCP(Claude Desktop / Cursor / Windsurf), VSCode, JS SDK, REST API |
| 크리에이티브 도구 | 없음 | Pro 및 Max의 Image / Video / Music / Code 스튜디오 |
| BYOK | N/A | Max에서 가능 — Anthropic, Replicate, Leonardo, ElevenLabs |
| 설정 복잡성 | 높음 — 그래프 DB 개념, 통합 작업 | 가입하고 채팅 — 사용자를 위한 인프라 없음 |
| 가격 | 오픈 소스 커뮤니티 에디션 · 클라우드 / 엔터프라이즈(맞춤) | Starter $14/월 · Pro $29/월 · Max $99/월 |
Zep의 오픈 소스 커뮤니티 에디션은 그래프 데이터베이스를 셀프 호스팅하고 통합 코드를 작성하면 무료로 실행됩니다. 호스팅된 클라우드 및 엔터프라이즈 티어는 요청 시 견적되며 규모에서 AI 에이전트를 출시하는 팀을 대상으로 합니다. Alma의 가격은 간단하고 최종 사용자 친화적입니다: Starter $14/월(무제한 메모리, Haiku + Sonnet), Pro $29/월(1M 토큰 컨텍스트의 Opus 4.7, 무제한 환경, 크리에이티브 스튜디오 추가), Max $99/월(API, MCP 서버, VSCode 확장 프로그램, SDK, BYOK 추가). 연간 청구는 모든 유료 플랜에서 "10개월 지불, 12개월 받기"입니다.
도구 전반의 최종 사용자 메모리. 사용자가 Claude Desktop, Cursor, VSCode, 웹 전반에 메모리가 있는 AI를 원합니다. Zep에는 최종 사용자 제품이 없습니다 — 다른 사람의 제품에 임베딩할 인프라입니다. Alma는 최종 사용자 제품 자체입니다: 가입하고, MCP 서버를 연결하고, 지원되는 모든 클라이언트에 5분 안에 메모리가 있습니다.
시간적 추론이 있는 B2B 고객 지원 에이전트. 엔지니어링 팀이 지원 티켓을 처리하고 "Y 날짜에 계정 X에 대해 무엇을 알았나" 또는 "계약 조건이 언제 변경되었나"에 대해 추론해야 하는 AI 에이전트를 구축하고 있습니다. Zep의 시간적 지식 그래프(Graphiti)는 이를 위해 목적에 맞게 구축되었습니다 — 엔티티는 일급 시민이고, 속성은 시간 전반에 추적되며, 그래프 쿼리는 시간적 질문에 자연스럽게 답합니다. Alma의 타입 3-레이어 모델은 검색을 통해 "X에 대해 무엇을 알고 있나"에 답할 수 있지만 명시적인 시간적 그래프 쿼리를 노출하지 않습니다 — 그것이 Zep의 차별화된 강점입니다.
자체 AI 사이드 프로젝트에서 메모리를 원하는 솔로 개발자. 개발자가 작은 AI 도구를 구축하고 그래프 데이터베이스를 세우고, 마이그레이션을 실행하고, 그래프 쿼리 코드를 작성하지 않고 영속 메모리를 원합니다. Max의 Alma SDK($99/월)는 HTTP API와 함께 완전한 인지 레이어(메모리 + Soul + 컨텍스트 조립)를 제공합니다. Zep의 셀프 호스팅 커뮤니티 에디션도 이 경우 무료이지만 첫 번째 기능이 출시되기 전에 엔지니어링 투자를 기대합니다.
시간적 엔티티 추론이 경험의 핵심인 AI 에이전트 제품을 구축하는 엔지니어링 팀이라면 Zep을 선택하세요 — 계정을 추적하는 고객 지원 AI, 몇 주에 걸쳐 가설을 따르는 리서치 에이전트, 사실이 언제 변경되었는지와 왜 변경되었는지 정확히 알아야 하는 엔터프라이즈 워크플로 자동화. "Y 날짜에 엔티티 X의 상태를 보여줘"가 답해야 할 실제 쿼리일 때 그래프 모델이 보상받습니다. 통합 코드와 아마도 래퍼 UI를 작성할 것입니다; 그것이 거래입니다.
인프라를 구축하는 대신 AI 메모리를 사용하고 싶다면 Alma를 선택하세요. 가입하고, 채팅을 시작하면 메모리가 작동합니다. Cursor / Claude Desktop / VSCode / Windsurf에서도 작업한다면 MCP 서버(무료)를 설치하면 동일한 메모리가 사용자를 따라갑니다. 구조화된 AI 정체성(Soul Engine), 번들된 크리에이티브 스튜디오 또는 저렴한 단일 사용자 구독을 원한다면 Alma를 선택하세요. Alma를 자신의 앱에 임베딩하려는 개발자는 Max 플랜($99/월)에서 SDK, MCP 서버, REST API를 얻습니다 — 단순한 메모리 백엔드가 아닌 완전한 인지 레이어.
Alma는 시간적 인식이 있나요? 예, 하지만 다른 모델로. 메모리는 생성 및 마지막 액세스 타임스탬프를 가집니다; episodes는 시간 순서로 정렬된 대화 요약입니다; 중요도 감쇠(5요소 스코어링은 최근성 10% 포함)는 오래된 메모리가 자연스럽게 사라지게 합니다. "시간 T의 상태"를 위한 그래프 쿼리 언어가 없습니다 — 그것이 Zep의 차별화된 기능이지 Alma의 것이 아닙니다.
Alma는 엔티티 지식 그래프가 있나요? 예, 내부적으로. 엔티티 추출은 모든 메모리 생성에서 휴리스틱하게 실행되며(읽기 시 추가 LLM 비용 없음) 검색 시간에 사용되는 그래프를 공급합니다. 오늘날 그래프로서 사용자 쿼리 가능하지 않습니다; 사용자 대상 모델은 "memories / episodes / procedures"로 유지됩니다.
내 AI 에이전트 제품에서 Alma가 Zep을 대체할 수 있나요? 때로는. 에이전트가 최종 사용자 대상이고 메모리 요구가 "세션 전반에서 선호도, 결정, 컨텍스트를 기억"이라면 Max의 Alma SDK + REST API가 래퍼를 구축하지 않고 필요한 것을 제공합니다. 명시적인 시간적 그래프 쿼리가 필요하다면 Zep이 올바른 도구입니다.
Alma는 오픈 소스인가요? 아니요. Alma는 호스팅된 SaaS입니다. Zep은 셀프 호스팅할 수 있는 오픈 소스 커뮤니티 에디션을 제공합니다.
Zep은 명시적인 시간적 그래프 추론이 필요한 AI 에이전트를 출시하는 엔지니어링 팀을 위해 목적에 맞게 구축되었습니다. Alma는 인프라 작업 없이 완전한 메모리 제품(채팅, Soul Engine, MCP, 크리에이티브 스튜디오)을 원하거나, 자신의 앱을 위한 인지 레이어가 필요하지만 타입 메모리 모델과 Soul Engine을 직접 작성하고 싶지 않을 때 올바른 도구입니다. Starter 플랜($14/월)은 5분 안에 제품을 종단 간 보여줍니다.
플랜 보기 · 플랜 보기 · 개발자 문서 및 SDK