Mai 2026 · 9 min de lecture · Fran Olivares, fondateur d’OlivaresAI
Le trafic de recherche et les discussions de développeurs confondent souvent les deux parce qu’ils sont apparus en 2024-2025 comme des moyens de rendre l’IA « plus capable », mais les dimensions qu’ils étendent sont orthogonales. Ce guide explique ce que fait réellement chacun, les questions auxquelles chacun répond et les architectures qui les combinent pour que vous puissiez choisir le bon outil — ou le bon binôme — pour l’agent que vous construisez.
Computer Use est une capacité de l’API Claude où le modèle reçoit des captures d’écran d’un bureau ou d’un navigateur et répond avec des appels d’outils structurés décrivant les actions à effectuer : déplacer la souris vers (x, y), cliquer, taper une chaîne, prendre une autre capture. La boucle applicative exécute ces actions sur une machine réelle (ou virtualisée) et renvoie la capture suivante. Le modèle est, en pratique, en train de piloter un ordinateur de la même manière qu’un humain — par pixels, clics et frappes — au lieu de passer par des API.
Cela débloque des tâches auparavant impossibles sans intégration sur mesure ou humain dans la boucle : remplir des formulaires dans un SaaS hérité sans API, naviguer dans des outils internes, scraper des tableaux de bord protégés, faire du QA end-to-end d’une web app, des workflows « fais ma déclaration d’impôts », une recherche multi-étapes qui traverse trois sites différents. Le compromis : la latence (chaque tour est un aller-retour de capture d’écran), le coût (les tokens d’entrée image s’accumulent vite) et la fiabilité (le modèle clique parfois au mauvais endroit sur des interfaces denses).
Alma est la couche qui retient faits, préférences, décisions et contexte de conversation à travers chaque session d’IA — pour que l’assistant se comporte comme un collaborateur continu unique au lieu de se réinitialiser à chaque tour. Les mémoires sont typées et structurées (préférences, décisions, notes de projet, règles d’identité), indexées sémantiquement avec des embeddings vectoriels et assemblées dans le prompt système de chaque nouvelle conversation en moins de 100 ms via l’ assemblage de contexte.
Contrairement à Computer Use, Alma n’agit pas sur le monde. Elle ne clique pas, ne tape pas, ne fait pas défiler, ne navigue pas. Ce qu’elle fait, c’est rendre le modèle que vous utilisez — Claude, ChatGPT, Gemini, votre agent sur mesure — conscient d’un arc cohérent et long de qui est l’utilisateur et de ce qui a déjà été décidé. Lisez l’analyse approfondie dans Persistent Memory for AI: Complete 2026 Guide.
Deux raisons. D’abord, les deux sortent avec le titre « rendre l’IA plus capable », ce qui écrase toute dimension de capacité dans une seule barre de recherche. Ensuite, les deux reposent sur l’utilisation d’outils sous le capot — Computer Use expose des outils de contrôle d’ordinateur, Alma expose des outils de contrôle de mémoire — donc du point de vue de l’intégration développeur la surface API se ressemble superficiellement (prompt système + outils + boucle). En dessous, les modes de défaillance, les profils de latence et les propositions de valeur sont complètement différents.
Le modèle mental le plus propre : Computer Use, c’est faire. La mémoire persistante, c’est savoir. Un agent qui peut faire sans savoir refait les mêmes étapes de configuration à chaque session. Un agent qui sait sans pouvoir faire peut conseiller mais pas exécuter. Un véritable agent en production a souvent besoin des deux.
Utilisez Computer Use quand le travail se passe à l’intérieur d’une interface que le modèle ne peut pas atteindre via API. Exemples concrets : remplir des feuilles de temps dans un logiciel d’entreprise hérité, télécharger des rapports depuis un portail fournisseur, manipuler une feuille de calcul à l’intérieur d’une application de bureau, naviguer dans un SaaS qui n’a volontairement pas d’API publique, exécuter une séquence complexe de clics à travers plusieurs onglets de navigateur. Si une phrase de la requête de l’utilisateur est « va sur le site X, clique sur Y, copie la valeur, colle-la dans Z », c’est le terrain de Computer Use.
Quand NE PAS l’utiliser : tout ce qui a une vraie API. Appeler directement l’API de GitHub est dramatiquement plus rapide, moins cher et plus fiable que de demander à Claude de se connecter au tableau de bord GitHub et de cliquer. Computer Use est la solution de repli pour la longue traîne d’outils sans intégrations propres, pas le chemin principal pour ceux qui en ont.
Utilisez la mémoire persistante chaque fois que l’utilisateur veut que l’IA se comporte comme un collègue qui se souvient des conversations, préférences et décisions antérieures — au lieu de repartir d’une page blanche à chaque fois. Exemples concrets : un copilote de code qui se souvient de votre stack, de vos règles de linter, des décisions d’architecture prises la semaine dernière, des conventions sur lesquelles votre équipe s’est mise d’accord le sprint dernier. Un assistant d’écriture qui se souvient de votre voix, de votre audience et des titres de travail de vos projets. Un agent de gestion de projet qui suit les parties prenantes, les SLA et les risques sur plusieurs jours. Voir l’analyse complète dans Building a PM Agent with Claude API and Persistent Memory.
Quand NE PAS l’utiliser : les requêtes transactionnelles ponctuelles où il n’y a rien qui vaille la peine d’être retenu. « Quelle est la capitale de l’Australie ? » est sans état par définition. La mémoire persistante a un coût — même faible — et elle ne paie que quand il y a un arc de travail long à se rappeler.
Oui — et c’est là que se trouvent les architectures d’agents les plus intéressantes de 2026. Le schéma est simple : la mémoire persistante détient le contexte longue durée (qui est cet utilisateur, qu’essaie-t-il de faire à travers les sessions, qu’avons-nous convenu la fois dernière), et Computer Use est l’outil que l’agent saisit quand la prochaine action concrète requiert d’interagir avec une UI. La couche de mémoire informe le prompt système ; la boucle Computer Use exécute des tâches spécifiques dans ce contexte informé.
Un exemple travaillé : un agent personnel « fais mon admin ». La mémoire persistante détient la banque de l’utilisateur, son numéro fiscal, les fournisseurs récurrents, les catégories de dépenses mensuelles, les décisions antérieures sur les abonnements à annuler, etc. Quand l’utilisateur dit « traite les factures de ce mois », l’agent assemble le contexte (connaît les fournisseurs, les règles de catégorisation, la banque), puis utilise Computer Use pour se connecter au portail bancaire, à l’outil de facturation SaaS et à l’application web du comptable pour faire le workflow multi-étapes. Sans mémoire, l’agent redemande chaque détail tous les mois. Sans Computer Use, l’agent ne peut que décrire quoi faire, pas le faire.
Trois couches, de haut en bas :
POST /api/v1/context/assemble pour construire un prompt système enrichi de mémoires, épisodes, procédures et blocs Soul pertinents. Après l’appel LLM, appelez POST /api/v1/memories/extract pour extraire les nouveaux faits de la conversation. La couche de mémoire est indépendante du fournisseur LLM — elle fonctionne pareil avec Claude, GPT ou Gemini.computer_use_20250124 d’Anthropic. À chaque tour, le modèle reçoit le prompt système assemblé + la requête de l’utilisateur + la dernière capture d’écran (si un appel Computer Use précédent en a renvoyé une). Il répond soit avec du texte, soit avec un appel d’outil structuré (computer.screenshot, computer.click, computer.type, etc.).Les boucles de mémoire et de Computer Use n’interfèrent pas. Ce sont des outils indépendants que l’agent choisit. La couche de mémoire rend l’agent plus intelligent ; Computer Use rend l’agent capable de finir le travail.
La mémoire est peu coûteuse et rapide. L’assemblage de contexte est de ~30–80 ms et de quelques centimes pour mille appels. Computer Use est coûteux et lent — les tokens d’entrée image dominent le coût, et chaque tour attend une capture d’écran. Une tâche Computer Use typique fait 10 à 30 tours, chaque tour streamant ~2 à 5 secondes. Une tâche Computer Use de 2 minutes peut coûter $0.10-$0.50 en frais d’API ; une tâche de 10 minutes peut dépasser $1.
Implication pratique : concevez l’agent pour que la mémoire fasse le gros du travail sur ce qui est déjà connu et que Computer Use soit réservé aux parties qui requièrent véritablement une interaction UI. Si l’agent saisit Computer Use pour chercher des données qui sont en mémoire, vous payez le tarif des captures d’écran pour une requête au tarif centimes. L’architecture devrait toujours privilégier le rappel mémoire à la redécouverte.
Non. Alma est bâti sur l’API d’Anthropic — Claude est le LLM qui propulse le chat, l’extraction, l’assistant à l’intérieur de l’application web Alma, les outils d’écriture, les boucles d’agent. Alma est la couche de mémoire qui rend les modèles d’Anthropic plus utiles lorsqu’ils sont utilisés à l’échelle par des individus ou des équipes. Computer Use est l’une des autres capacités d’Anthropic, complémentaire à la mémoire. Le bon cadrage : Alma + Anthropic Claude (avec ou sans Computer Use) est une stack, pas une comparaison versus.
Si votre intérêt est la mémoire: commencez sur alma.olivares.ai, installez le serveur MCP dans Claude Desktop, et vous avez une mémoire persistante en cinq minutes — voir How to Use MCP for AI Memory: 5-Minute Setup. Si votre intérêt est Computer Use: il est restreint par Anthropic et vit derrière une en-tête bêta sur l’API Claude ; leur documentation guide la mise en place. Si vous construisez les deux: prototypez la mémoire d’abord (l’intégration est plus simple et la valeur se cumule à chaque session), puis empilez Computer Use par-dessus pour les actions spécifiques que l’agent doit effectuer.
Lecture associée : Persistent Memory for AI: Complete 2026 Guide · Building a PM Agent with Claude API and Persistent Memory · Architecture de mémoire à trois couches · Comparaison Alma vs Claude Memory · REST API d’Alma.