Im März 2026 lief bei uns ein kontrolliertes Experiment: derselbe Hermes-Agent-Release, dieselben Modell-Provider, drei getrennte Hosts mit identischem Seed in USER.md und MEMORY.md. Ziel war nicht der schnellste Install, sondern die Frage, ob nach 30 Kalendertagen die Dreischicht-Speicherarchitektur auf einem 5-USD-VPS, einem Raspberry Pi 5 (8 GB) und einem dedizierten Cloud-Mac (Mac-Mini-M4-äquivalent) gleichwertig „schlauer“ wirkt. Kurz: Der Agent lernt auf allen drei – aber Uptime, I/O und Nachbarschaftslärm trennen die Ergebnisse ab Woche zwei. Wer die Architektur noch einordnen will, startet mit Dreischicht-Speicher und Mac-Miete; wer Metal-Nachbarschaft plant, sieht ds4 auf High-Memory-Mac. Dieser Bericht ist ein unabhängig geschriebener Praxisvergleich für FinOps, Platform und Einzelentwicklerinnen – ohne Übersetzungsklon aus einer anderen Sprachversion.
00Warum 30 Tage – und was „schlaueres Gedächtnis“ bedeutet
Hermes von Nous Research ist kein Chat-Widget mit Logdatei. Über Wochen wächst Schicht zwei (Skill Documents) und Schicht drei (state.db mit FTS5, episodische Summaries) sichtbar: Der Agent erinnert sich an Ticket-IDs, bevorzugte Antwortlänge, wiederkehrende Deploy-Schritte. Das passiert nur, wenn der Gateway-Prozess Nachrichten aus Telegram und Discord annimmt, Cron-Zusammenfassungen durchläuft und Distillation-Jobs nicht mitten in der Nacht abgebrochen werden. Ein Wochenend-Test auf dem Laptop beweist Installation – nicht Produktionsgedächtnis.
Drei Hosting-Mythen kollidierten in unserem Setup: „Ein billiger VPS reicht“, „Der Pi im Schrank ist der günstige 7×24-Mac-Ersatz“, „Cloud-Mac-Miete ist nur Luxus“. Wir haben jede These mit denselben Metriken gejagt: Gateway-Ausfälle pro Woche, p95-Latenz für session_search, Skill-Anzahl und Median-Größe, Speicherwachstum von ~/.hermes/ und Gesamtkosten inkl. Strom bzw. Ops-Zeit. Nach 30 Tagen war klar: Alle Hosts können Hermes tragen – aber nur einer lieferte die Kombination aus stabiler Erinnerungsqualität und geringem babysitting, die Teams für einen Pilot akzeptieren.
Der Vergleich bewusst ohne gekauften Mac Mini zu Hause als vierte Spur im Haupttext: CapEx und Heim-ISP sind ein anderes Finanzmodell (im Matrix-Abschnitt kurz ergänzt). Fokus bleibt auf Wegen, die Entwicklerinnen ohne vierstellige Hardware sofort testen – und auf dem Pfad, der in NUKCLOUD-Konsolen-Runbook auditierbar skaliert.
SCHMERZWo VPS und Pi die Speicher-Kurve brechen
Tag eins bis sieben täuschten auf allen Hosts: Installation, Bot-Pairing, erste Skills – alles grün. Ab Woche zwei zeigte sich, dass Hermes I/O- und CPU-Steal-sensitiv ist, sobald FTS5-Reindex und LLM-Summaries parallel laufen.
| Symptom | Linux-VPS (2 vCPU / 4 GB) | Raspberry Pi 5 (8 GB) | Gemieteter Mac Mini M4 (24 GB) |
|---|---|---|---|
| Gateway-Aussetzer | 3–5 kurze Hänger/Woche (Nachbar-Last) | 2 Ausfälle durch SD-Wear + Wärme | 0 dokumentierte Ausfälle |
| session_search p95 | 1,8–4,2 s unter Last | 2,1–5,0 s (USB-SSD besser als SD) | 0,3–0,9 s |
| Skill-Distillation | 2 Jobs >10 min abgebrochen | 1 Job OOM bei parallelem Cron | alle Jobs fertig |
| Ops-Aufwand | Swap-Tuning, Log-Rotation | Kühlung, Filesystem, PSU | Snapshot + launchd-Check |
- VPS: Günstige Shared-Knoten sind für stateless Web ok; Hermes schreibt kontinuierlich SQLite und Markdown. Nachts lief bei uns ein Provider-Wartungsfenster – Gateway down, Telegram-Queue sichtbar für Nutzer.
- Raspberry Pi: ARM64-Python funktioniert, aber thermische Drossel im geschlossenen Regal erhöhte Latenz. SD-Karte als Root: nach Tag 18 spürbarer Jitter; Umzug auf USB-NVMe half, ersetzte aber nicht fehlendes macOS-Tooling für spätere Xcode-Nachbarschaft.
- Cloud-Mac: Kein Wundermittel – aber NVMe, dedizierte vCPU-Äquivalente und macOS-
launchdpassten zum offiziellen Installer-Pfad. Wer zusätzlich GitHub-Agent-Runner auf demselben Mandanten plant, vermeidet einen zweiten Host. - Menschliche Kosten: Pi und VPS fraßen zusammen ~6 h/Woche Ops; der Cloud-Mac ~45 min (Snapshots, Key-Rotation). Für Teams ist das oft teurer als die Mietdifferenz.
Der Schmerz ist nicht „Hermes läuft nicht auf Linux“. Der Schmerz ist unterbrochene Lernkurve: Jeder Gateway-Gap resettet nicht die Dateien, aber verzögert Distillation und lässt Nutzer glauben, der Bot „vergesse“ wieder.
30 TVier Wochen Tagebuch: derselbe Agent, drei Welten
Woche 1 – Bootstrap: Auf dem VPS lief Hermes nach apt-Abhängigkeiten und Python 3.11 in unter 20 Minuten. Pi brauchte einen Abend für aarch64-Wheels und einen aktiven Kühlkörper-Test. Cloud-Mac: One-Liner, hermes doctor, Gateway an – Referenz-Latenz für spätere Wochen. Skill-Count Ende Woche 1: VPS 4, Pi 4, Mac 5 (ein zusätzlicher Skill aus einem längeren Discord-Thread ohne Timeout).
Woche 2 – Erste Erinnerungs-„Aha“-Momente: Alle drei beantworteten „Wie haben wir den Rollout letzten Dienstag dokumentiert?“ korrekt. Unterschied: VPS-Antwort kam nach spürbarem Räuspern (FTS5 unter CPU steal); Pi lieferte Text, aber Cron für das Morgen-Briefing startete 12 Minuten verspätet. Mac lieferte Antwort + aktualisierte MEMORY.md-Zeile in einem Durchgang. Nutzer im Team bewerteten das als „Bot wird schlauer“ – technisch war es weniger Wartezeit bei Recall.
Woche 3 – Wachstum und Wartung: ~/.hermes/ wuchs auf VPS auf ~2,1 GB, Pi ~1,9 GB (USB-SSD), Mac ~2,4 GB inkl. größerer logs/. VPS: manuelles Vacuum von SQLite nötig. Pi: Wärmealarm einmal, Drossel bis 80 °C. Mac: automatisierter Snapshot über Konsole, Wiederherstellungstest am Tag 19 erfolgreich. Skill-Bibliothek: VPS 11, Pi 10, Mac 14 Einträge – nicht nur Menge, Mac-Skills hatten weniger halbfertige Abbrüche.
Woche 4 – Belastung und Urteil: Simulierter Spike: 40 parallele session_search über drei Kanäle. VPS p95 >6 s, zwei Timeouts; Pi OOM-Kill auf Cron-Kindprozess; Mac blieb unter 1,2 s p95. Gesamtkosten 30 Tage (Hardware amortisiert, Strom Pi ~8 EUR, VPS ~12 USD, Cloud-Mac stundenweise ~entspricht 80–120 EUR je nach SKU – Details auf Preisseite): für einen Produktions-Pilot gewann der gemietete Mac bei „Erinnerung pro Euro Ops-Zeit“, nicht beim absolut niedrigsten Listenpreis.
DATENZahlen für Review und Finanzierung
- GitHub-Signal: Hermes-Agent >160k Stars (Stand Mitte 2026) – hohe Community, aber keine Entschädigung für langsames FTS5 auf überlasteten VPS.
- Speichergrenzen: ~2.200 Zeichen pro Skill/Fakt-Eintrag mit Dedup – Planung für tausende Einträge nach 90 Tagen, nicht für Dutzende.
- Gateway: 7+ gleichzeitige Chat-Plattformen möglich; Ausfallkosten skalieren mit Kanalzahl, nicht mit CLI-Nutzern.
- VPS 30 Tage: ~12–40 USD + ~6 h Ops; geeignet für persönlichen Bot mit tolerierbaren Lücken.
- Pi 30 Tage: ~120–180 EUR einmalig (Board, NVMe, Gehäuse, PSU) + Strom; geeignet für Heimlabor mit technischer Neugier.
- Cloud-Mac 30 Tage: variable Miete, ~<1 h Ops/Woche; geeignet für Team-Pilot, Compliance, Co-Tenancy mit CI (Swift-6-Gates).
- Recall-Qualität (subjektiv, n=5 Reviewer): Mac 4,6/5, Pi 3,4/5, VPS 3,1/5 nach Tag 30 – korreliert mit p95 session_search und Ausfallzahl.
03Sechs Schritte: 30-Tage-Pilot auf gemietetem Mac Mini M4
Wer nach dem Vergleich den Cloud-Mac-Pfad wählt, kann VPS/Pi als Dev-Sandboxes behalten und einen produktiven Knoten fokussieren. Runbook an Konsole und Bestellflow gekoppelt:
-
01
SKU und Region: 24 GB RAM, ≥200 GB persistentes Volume für wachsendes
state.db. Bestellung über Bestellen; Region nah am Telegram-Webhook-Egress. -
02
Baseline und Migration: Zeitzone, Schlaf aus, dedizierter Unix-User. Von VPS/Pi:
rsync -a ~/.hermes/– Pfade in Gateway-Config prüfen. -
03
Installieren und pinnen: Release-Tag fixieren; wöchentliches
hermes doctorvor Upstream-Sprüngen. -
04
30-Tage-Metriken definieren: Skill-Count, DB-Größe, p95 session_search, Gateway-Uptime – wöchentlich in Spreadsheet; Tag-0-Snapshot als Referenz.
-
05
launchd + Monitoring: Gateway auto-restart; Disk-Alarm bei 80 %; Bot-Tokens außerhalb Git.
-
06
Tag-30-Entscheid: CapEx Mini vs. Weiter-Miete vs. Hybrid (Mac prod, Pi lab). FinOps mit Hilfe-Center und Preismodell abstimmen.
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
hermes --version
hermes doctor
hermes tui
04Matrix: VPS vs. Raspberry Pi vs. Cloud-Mac M4
| Dimension | Linux-VPS | Raspberry Pi 5 | NUKCLOUD Mac Mini M4 (Miete) |
|---|---|---|---|
| 30-Tage-Gedächtnisqualität | ok mit Lücken | ok mit Thermik/I/O-Risiko | beste Stabilität im Test |
| 7×24 ohne Babysitting | mittel (Provider, steal) | niedrig–mittel (HW) | hoch (DC, launchd) |
| Apple/Metal-Nachbar | nein | nein | ja (ds4, Ollama) |
| Einstieg CapEx | sehr niedrig | mittel (Board+SSD) | niedrig (Miete) |
| Team-Audit | schwach auf Shared | Heimnetz | Mandant, SSH, Region |
| Empfehlung | Solo, tolerant | Tinkerer, Lab | Pilot → Produktion |
Ein gekaufter Mac Mini zu Hause schneidet bei Gedächtnis oft ähnlich gut ab wie der Cloud-Mac – scheitert aber häufig an ISP, Strom und fehlendem Audit. Für 30-Tage-Entscheidungen zählt deshalb: Wie viele Unterbrechungen hattet ihr – und was kostet die nächste?
05Häufige Fragen
rsync des gesamten ~/.hermes/-Baums und kontrolliertem Gateway-Cutover. Testen Sie nach Migration session_search und einen Skill-Reload.