مايو 2026 · 9 دقائق قراءة · Fran Olivares، مؤسس OlivaresAI
حركة البحث وثرثرة المطورين كثيراً ما يخلطون بين الاثنين لأن كليهما ظهر في 2024-2025 كطرق لجعل الذكاء الاصطناعي "أكثر قدرة"، لكن الأبعاد التي يمتدان فيها متعامدة. يأخذك هذا الدليل عبر ما يفعله كل واحد فعلاً، والأسئلة التي يُجيب عليها كل واحد، والمعماريات التي تجمعهما حتى تستطيع اختيار الأداة الصحيحة — أو الزوج الصحيح — للوكيل الذي تبنيه.
Computer Use قدرة في Claude API حيث يتلقى النموذج لقطات شاشة لسطح مكتب أو متصفح ويستجيب باستدعاءات أدوات مهيكلة تصف الإجراءات الواجب اتخاذها: انقل الفأرة إلى (x, y)، انقر، اكتب نصاً، خذ لقطة شاشة أخرى. تُشغّل حلقة التطبيق تلك الإجراءات على جهاز حقيقي (أو مُحاكى) وتُعيد لقطة الشاشة التالية. النموذج، فعلياً، يقود حاسوباً بنفس الطريقة التي يفعلها الإنسان — عبر البكسلات والنقرات وضغطات المفاتيح — بدلاً من APIs.
هذا يُفتح مهام كانت سابقاً مستحيلة دون إما تكامل مخصص أو إنسان في الحلقة: ملء النماذج في SaaS القديم الذي ليس له API، التنقل في الأدوات الداخلية، كشط لوحات المعلومات المحمية، QA من البداية إلى النهاية لتطبيق ويب، سير عمل "افعل ضرائبي"، بحث متعدد الخطوات يعبر ثلاثة مواقع مختلفة. المقايضة هي الكمون (كل دور ذهاب وإياب لقطة شاشة)، والتكلفة (توكنات إدخال الصورة تتراكم بسرعة)، والموثوقية (النموذج أحياناً ينقر على الشيء الخطأ في واجهات كثيفة).
Alma هي الطبقة التي تحتفظ بالحقائق والتفضيلات والقرارات وسياق المحادثة عبر كل جلسة ذكاء اصطناعي — بحيث يتصرف المساعد كمتعاون مستمر واحد بدلاً من إعادة الضبط في كل دور. الذكريات مكتَبة ومهيكلة (تفضيلات، قرارات، ملاحظات مشروع، قواعد هوية)، ومُفهرَسة دلالياً بـ vector embeddings، ومُجمَّعة في موجّه نظام كل محادثة جديدة في أقل من 100 ms عبر تجميع السياق في Alma.
على عكس Computer Use، لا تعمل Alma على العالم. لا تنقر، لا تكتب، لا تُمرّر، لا تتنقل. ما تفعله هو جعل أي نموذج تستخدمه — Claude، ChatGPT، Gemini، وكيلك المخصص — مدركاً لقوس طويل متماسك من من هو المستخدم وما تقرر بالفعل. اقرأ الغوص العميق في الذاكرة الدائمة للذكاء الاصطناعي: الدليل الكامل 2026.
سببان. أولاً، كلاهما يشحن بعنوان "اجعل الذكاء الاصطناعي أكثر قدرة"، الذي يطوي كل بُعد قدرة في صندوق بحث واحد. ثانياً، كلاهما يعتمد على استخدام الأدوات تحت الغطاء — Computer Use يكشف أدوات تحكم بالحاسوب، Alma تكشف أدوات تحكم بالذاكرة — فمن زاوية تكامل المطور تبدو سطح API مشابهاً ظاهرياً (موجّه نظام + أدوات + حلقة). تحتها، أوضاع الفشل، وملفات الكمون، وعروض القيمة مختلفة تماماً.
النموذج العقلي الأنظف: Computer Use عن الفعل. الذاكرة الدائمة عن المعرفة. وكيل يستطيع الفعل دون المعرفة يُكرّر نفس خطوات الإعداد في كل جلسة. وكيل يعرف دون أن يستطيع الفعل يستطيع النصح لا التنفيذ. وكيل إنتاج حقيقي كثيراً ما يحتاج كليهما.
استخدم Computer Use عندما يحدث العمل داخل واجهة لا يستطيع النموذج الوصول إليها عبر API. أمثلة ملموسة: ملء جداول الوقت في برمجيات المؤسسات القديمة، تحميل التقارير من بوابة بائع، التلاعب بجدول بيانات داخل تطبيق سطح مكتب، التنقل في SaaS عمداً ليس له API عام، تشغيل تسلسل معقد من النقرات عبر عدة تبويبات متصفح. إذا كانت جملة في طلب المستخدم "اذهب إلى موقع X، انقر Y، انسخ القيمة، الصقها في Z"، فهذا منطقة Computer Use.
متى لا تستخدمه: أي شيء له API حقيقي. استدعاء GitHub API مباشرة أسرع وأرخص وأكثر موثوقية بشكل كبير من طلب Claude تسجيل الدخول إلى لوحة GitHub والنقر حولها. Computer Use هو الاحتياط للذيل الطويل من الأدوات بدون تكاملات مناسبة، لا المسار الأساسي للتي لها.
استخدم الذاكرة الدائمة كلما أراد المستخدم للذكاء الاصطناعي التصرف كزميل يتذكر المحادثات والتفضيلات والقرارات السابقة — بدلاً من البدء من لوح فارغ في كل مرة. أمثلة ملموسة: copilot برمجة يتذكر مكدسك، وقواعد linter، والقرارات المعمارية التي اتخذتها الأسبوع الماضي، والاتفاقيات التي وافق عليها فريقك في sprint الأخير. مساعد كتابة يتذكر صوتك وجمهورك والعناوين العاملة لمشاريعك. وكيل إدارة مشاريع يتتبع أصحاب المصلحة وSLAs والمخاطر عبر الأيام. انظر التفصيل الكامل في بناء وكيل PM بـ Claude API والذاكرة الدائمة.
متى لا تستخدمها: استعلامات لمرة واحدة معاملاتية حيث لا يوجد شيء يستحق التذكر. "ما عاصمة أستراليا؟" عديم الحالة بالتعريف. للذاكرة الدائمة تكاليف عامة — حتى صغيرة — وتؤتي ثمارها فقط عندما يكون هناك قوس طويل من العمل للتذكر.
نعم — وهنا تجلس معماريات الوكلاء الأكثر إثارة في 2026. النمط مباشر: الذاكرة الدائمة تحتفظ بالسياق طويل العمر (من هو هذا المستخدم، ما يحاولون فعله عبر الجلسات، ما اتفقنا عليه آخر مرة)، وComputer Use هي الأداة التي يصل إليها الوكيل عندما يتطلب الإجراء الملموس التالي التفاعل مع واجهة. طبقة الذاكرة تُعلم موجّه النظام؛ حلقة Computer Use تُنفّذ مهام محددة ضمن ذلك السياق المُعلَم.
مثال معالَج: وكيل شخصي "افعل إدارياتي". الذاكرة الدائمة تحتفظ ببنك المستخدم، ورقم الضريبة، والبائعين المتكررين، وفئات النفقات الشهرية، والقرارات السابقة بشأن أي اشتراكات إلغاء، إلخ. عندما يقول المستخدم "عالج فواتير هذا الشهر"، يُجمّع الوكيل السياق (يعرف البائعين، وقواعد التصنيف، والبنك)، ثم يستخدم Computer Use لتسجيل الدخول إلى بوابة البنك، أداة فوترة SaaS، وتطبيق ويب المحاسب لفعل سير العمل متعدد الخطوات. دون ذاكرة، يُعيد الوكيل طرح كل تفصيل كل شهر. دون Computer Use، يستطيع الوكيل وصف ما يفعله فقط، لا فعله.
ثلاث طبقات، من الأعلى إلى الأسفل:
POST /api/v1/context/assemble لبناء موجّه نظام مُثرى بالذكريات والمقاطع والإجراءات وكتل Soul ذات الصلة. بعد استدعاء LLM، نادِ POST /api/v1/memories/extract لتنقيب الحقائق الجديدة من المحادثة. طبقة الذاكرة مستقلة عن مزود LLM — تعمل بنفس الطريقة مع Claude أو GPT أو Gemini.computer_use_20250124. في كل دور، يتلقى النموذج موجّه النظام المُجمَّع + طلب المستخدم + أحدث لقطة شاشة (إن أعادت استدعاء Computer Use سابق واحداً). يستجيب إما بنص أو باستدعاء أداة مهيكل (computer.screenshot، computer.click، computer.type، إلخ).حلقات الذاكرة وComputer Use لا تتداخل. هي أدوات مستقلة يختار منها الوكيل. طبقة الذاكرة تجعل الوكيل أذكى؛ Computer Use يجعل الوكيل قادراً على إنهاء العمل.
الذاكرة رخيصة وسريعة. تجميع السياق ~30-80 ms وبضع سنتات لكل ألف استدعاء. Computer Use غالٍ وبطيء — توكنات إدخال الصورة تهيمن على التكلفة، وكل دور ينتظر لقطة شاشة. مهمة Computer Use نموذجية 10-30 دور، كل دور يبث ~2-5 ثوانٍ. مهمة Computer Use لمدة دقيقتين قد تُكلف $0.10-$0.50 في رسوم API؛ مهمة 10 دقائق يمكن أن تتجاوز $1.
الانعكاس العملي: صمّم الوكيل بحيث تقوم الذاكرة بالعمل الثقيل على ما هو معروف بالفعل وComputer Use محجوز للأجزاء التي تتطلب فعلاً تفاعل واجهة. إذا وصل الوكيل إلى Computer Use للبحث عن بيانات في الذاكرة، فأنت تدفع بسعر لقطات الشاشة لاستعلام بسعر سنتات. ينبغي للمعمارية دائماً أن تُفضّل استحضار الذاكرة على إعادة الاكتشاف.
لا. Alma مبنية فوق API الخاص بـ Anthropic — Claude هو LLM الذي يُشغّل المحادثة، والاستخراج، والمساعد داخل تطبيق Alma الويبي، وأدوات الكتابة، وحلقات الوكيل. Alma هي طبقة الذاكرة التي تجعل نماذج Anthropic أكثر فائدة عند استخدامها في السعة من قبل الأفراد أو الفرق. Computer Use هي واحدة من قدرات Anthropic الأخرى، متكاملة مع الذاكرة. التأطير الصحيح هو أن Alma + Anthropic Claude (مع أو بدون Computer Use) مكدس، لا مقارنة مقابل.
إذا كان اهتمامك في الذاكرة: ابدأ في alma.olivares.ai، ثبّت خادم MCP في Claude Desktop، ولديك ذاكرة دائمة في خمس دقائق — انظر كيف تستخدم MCP لذاكرة الذكاء الاصطناعي: إعداد 5 دقائق. إذا كان اهتمامك في Computer Use: محظور بواسطة Anthropic ويعيش خلف رأس بيتا في Claude API؛ وثائقهم تأخذك عبر الإعداد. إذا كنت تبني كليهما: نمذج الذاكرة أولاً (التكامل أبسط والقيمة تتراكم عبر كل جلسة)، ثم اطبق Computer Use فوقها للإجراءات المحددة التي يحتاج الوكيل لاتخاذها.
قراءة ذات صلة: الذاكرة الدائمة للذكاء الاصطناعي: الدليل الكامل 2026 · بناء وكيل PM بـ Claude API والذاكرة الدائمة · معمارية الذاكرة بثلاث طبقات · مقارنة Alma مقابل ذاكرة Claude · Alma REST API.