En mars 2026, notre équipe plateforme a lancé une expérience contrôlée : une seule version de Hermes Agent, les mêmes fournisseurs de modèles, trois hôtes isolés avec le même contenu initial dans USER.md et MEMORY.md. La question n'était pas « qui installe le plus vite », mais « après 30 jours calendaires, la mémoire semble-t-elle réellement plus intelligente sur un VPS à 5 USD, un Pi 5 (8 Go) ou un Mac cloud dédié (profil Mac Mini M4) ? Réponse courte : l'agent apprend partout — mais l'uptime, l'I/O et le bruit des voisins divergent dès la semaine 2. Pour la couche mémoire, voir mémoire persistante et location Mac ; pour Metal à côté du gateway, ds4 sur Mac haute mémoire. Ce texte est rédigé en français, de façon autonome — pas une traduction mot à mot d'une autre locale.
00Pourquoi 30 jours — et que signifie « une mémoire qui s'améliore »
Hermes (Nous Research) n'est pas un chat avec fichier log. Sur plusieurs semaines, la couche skills (documents procéduraux) et la couche épisodique (state.db, FTS5, résumés LLM) grossissent de façon visible : l'agent retrouve des IDs de tickets, un ton préféré, des séquences de déploiement répétées. Cela suppose un processus gateway qui absorbe Telegram et Discord, des crons de synthèse et des jobs de distillation qui ne s'arrêtent pas à 3 h du matin. Un test week-end sur portable prouve l'installation — pas la mémoire de production.
Trois idées reçues se sont heurtées à nos métriques : « un VPS cheap suffit », « le Pi dans le placard remplace un Mac 7×24 », « louer un Mac cloud est du luxe ». Nous avons mesuré : pannes gateway par semaine, latence p95 de session_search, nombre et taille médiane des skills, croissance de ~/.hermes/ et coût total incluant ops humaines. Au jour 30, un seul profil combinait qualité de rappel stable et peu de babysitting — critère décisif pour un pilote d'équipe.
Nous avons volontairement laissé un Mac Mini acheté « maison » hors du récit principal (CapEx + FAI) ; il apparaît brièvement dans la matrice. L'objectif reste les chemins testables sans hardware à quatre chiffres, alignés sur le runbook console NUKCLOUD.
DOULEUROù VPS et Pi cassent la courbe d'apprentissage
Jours 1 à 7 : tout est vert (install, pairing, premiers skills). Semaine 2 : Hermes devient sensible au steal CPU et à l'I/O dès que réindex FTS5 et résumés LLM tournent en parallèle.
| Symptôme | VPS Linux (2 vCPU / 4 Go) | Raspberry Pi 5 (8 Go) | Mac Mini M4 loué (24 Go) |
|---|---|---|---|
| Coupures gateway | 3–5 micro-coupures/sem. (voisinage) | 2 arrêts (SD + chaleur) | 0 panne documentée |
| session_search p95 | 1,8–4,2 s sous charge | 2,1–5,0 s (NVMe USB > SD) | 0,3–0,9 s |
| Distillation skills | 2 jobs >10 min interrompus | 1 OOM avec cron parallèle | tous terminés |
| Charge ops | swap, rotation logs | refroidissement, FS, alim. | snapshot + launchd |
- VPS : idéal pour du web stateless ; Hermes écrit SQLite et Markdown en continu. Une fenêtre de maintenance nocturne a coupé le gateway — file Telegram visible côté utilisateurs.
- Raspberry Pi : Python aarch64 OK, mais throttle thermique dans un meuble fermé. SD en root : jitter au jour 18 ; migration vers NVMe USB aide sans apporter macOS ni Xcode voisins.
- Mac cloud : NVMe, CPU dédiés,
launchd— le chemin d'install officiel. Pour co-héberger un runner agent GitHub, un seul mandant évite un second hôte. - Coût humain : Pi + VPS ≈ 6 h/sem. d'ops ; Mac cloud ≈ 45 min (snapshots, clés). Souvent plus cher que l'écart de loyer.
La douleur n'est pas « Hermes ne tourne pas sur Linux ». C'est une courbe d'apprentissage hachée : chaque trou de gateway retarde la distillation et donne l'impression que le bot « oublie » à nouveau.
30 jJournal sur quatre semaines : un agent, trois mondes
Semaine 1 — Bootstrap : VPS opérationnel en ~20 min après dépendances apt et Python 3.11. Pi : une soirée pour les wheels aarch64 et test de dissipateur. Mac cloud : one-liner, hermes doctor, gateway — latence de référence. Skills fin S1 : VPS 4, Pi 4, Mac 5 (un skill long Discord sans timeout).
Semaine 2 — Premiers « aha » mémoriels : Les trois répondent correctement à « comment avons-nous documenté le rollout mardi dernier ? ». Différence : VPS hésite (FTS5 sous steal) ; le cron du brief matinal sur Pi décale de 12 min ; le Mac répond et met à jour MEMORY.md en un passage. L'équipe perçoit « le bot devient malin » — techniquement c'est surtout moins d'attente au rappel.
Semaine 3 — Croissance et maintenance : ~/.hermes/ ≈ 2,1 Go (VPS), 1,9 Go (Pi USB), 2,4 Go (Mac avec logs plus lourds). Vacuum SQLite manuel sur VPS ; alerte thermique Pi à 80 °C ; snapshot automatisé via console, restore testé jour 19. Bibliothèque skills : 11 / 10 / 14 — le Mac produit moins de brouillons interrompus.
Semaine 4 — Stress et verdict : Pic simulé : 40 session_search parallèles sur trois canaux. VPS p95 >6 s, deux timeouts ; Pi tue un enfant cron (OOM) ; Mac <1,2 s p95. Coût 30 jours (Pi ~8 EUR électricité, VPS ~12 USD, Mac cloud variable selon SKU — tarifs) : pour un pilote prod, le Mac loué gagne sur « mémoire par euro d'ops », pas sur le prix catalogue le plus bas.
DONNÉESChiffres pour revue et financement
- Signal GitHub : Hermes >160k stars (mi-2026) — communauté forte, pas de compensation pour FTS5 lent sur VPS saturés.
- Limites mémoire : ~2 200 caractères par entrée skill/fait avec dédup — planifier des milliers d'entrées à 90 jours.
- Gateway : 7+ plateformes chat possibles ; le coût d'indisponibilité scale avec le nombre de canaux.
- VPS 30 j : ~12–40 USD + ~6 h ops — bot perso tolérant aux trous.
- Pi 30 j : ~120–180 EUR matériel (carte, NVMe, boîtier) + courant — labo maison.
- Mac cloud 30 j : loyer variable, <1 h ops/sem. — pilote équipe, conformité, CI voisin (gates Swift 6).
- Qualité de rappel (5 reviewers, jour 30) : Mac 4,6/5, Pi 3,4/5, VPS 3,1/5 — corrélé à p95 et pannes.
03Six étapes : pilote 30 jours sur Mac Mini M4 loué
Après le comparatif, gardez VPS/Pi en lab et concentrez la prod sur un nœud Mac. Runbook lié à la console :
-
01
SKU et région : 24 Go RAM, volume persistant ≥200 Go pour
state.db. Commande via Commander ; région proche de l'egress webhook Telegram. -
02
Baseline et migration : fuseau, veille désactivée, utilisateur Unix dédié. Depuis VPS/Pi :
rsync -a ~/.hermes/— vérifier les chemins gateway. -
03
Installer et épingler : tag de release fixe ;
hermes doctorhebdomadaire avant upgrade upstream. -
04
Métriques 30 jours : nombre de skills, taille DB, p95 session_search, uptime gateway — snapshot hebdo ; jour 0 = référence.
-
05
launchd + monitoring : redémarrage auto gateway ; alerte disque 80 % ; tokens hors Git.
-
06
Décision jour 30 : acheter un Mini, prolonger la location, ou hybride. FinOps avec aide et grille tarifaire.
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
hermes --version
hermes doctor
hermes tui
04Matrice : VPS vs Raspberry Pi vs Mac M4 cloud
| Dimension | VPS Linux | Raspberry Pi 5 | Mac Mini M4 NUKCLOUD (location) |
|---|---|---|---|
| Mémoire à 30 jours | correct avec trous | correct, risque thermique/I/O | meilleure stabilité test |
| 7×24 sans babysitting | moyen | faible–moyen | élevé (DC, launchd) |
| Voisin Apple/Metal | non | non | oui (ds4, Ollama) |
| CapEx d'entrée | très bas | moyen | bas (loyer) |
| Audit équipe | faible en mutualisé | réseau maison | mandant, SSH, région |
| Recommandation | solo tolérant | tinkerer, lab | pilote → prod |
Un Mac Mini acheté peut égaler le Mac cloud sur la mémoire — mais échoue souvent sur FAI, alimentation et audit. Pour une décision à 30 jours : combien d'interruptions — et quel coût pour la suivante ?
05Questions fréquentes
rsync de tout ~/.hermes/, bascule gateway contrôlée, puis test session_search et rechargement d'un skill.