30 Tage Hermes Agent: Gedächtnis wird schlauer – VPS, Raspberry Pi oder gemietetes Mac Mini M4? (2026)

Im März 2026 lief bei uns ein kontrolliertes Experiment: derselbe Hermes-Agent-Release, dieselben Modell-Provider, drei getrennte Hosts mit identischem Seed in USER.md und MEMORY.md. Ziel war nicht der schnellste Install, sondern die Frage, ob nach 30 Kalendertagen die Dreischicht-Speicherarchitektur auf einem 5-USD-VPS, einem Raspberry Pi 5 (8 GB) und einem dedizierten Cloud-Mac (Mac-Mini-M4-äquivalent) gleichwertig „schlauer“ wirkt. Kurz: Der Agent lernt auf allen drei – aber Uptime, I/O und Nachbarschaftslärm trennen die Ergebnisse ab Woche zwei. Wer die Architektur noch einordnen will, startet mit Dreischicht-Speicher und Mac-Miete; wer Metal-Nachbarschaft plant, sieht ds4 auf High-Memory-Mac. Dieser Bericht ist ein unabhängig geschriebener Praxisvergleich für FinOps, Platform und Einzelentwicklerinnen – ohne Übersetzungsklon aus einer anderen Sprachversion.

00Warum 30 Tage – und was „schlaueres Gedächtnis“ bedeutet

Hermes von Nous Research ist kein Chat-Widget mit Logdatei. Über Wochen wächst Schicht zwei (Skill Documents) und Schicht drei (state.db mit FTS5, episodische Summaries) sichtbar: Der Agent erinnert sich an Ticket-IDs, bevorzugte Antwortlänge, wiederkehrende Deploy-Schritte. Das passiert nur, wenn der Gateway-Prozess Nachrichten aus Telegram und Discord annimmt, Cron-Zusammenfassungen durchläuft und Distillation-Jobs nicht mitten in der Nacht abgebrochen werden. Ein Wochenend-Test auf dem Laptop beweist Installation – nicht Produktionsgedächtnis.

Drei Hosting-Mythen kollidierten in unserem Setup: „Ein billiger VPS reicht“, „Der Pi im Schrank ist der günstige 7×24-Mac-Ersatz“, „Cloud-Mac-Miete ist nur Luxus“. Wir haben jede These mit denselben Metriken gejagt: Gateway-Ausfälle pro Woche, p95-Latenz für session_search, Skill-Anzahl und Median-Größe, Speicherwachstum von ~/.hermes/ und Gesamtkosten inkl. Strom bzw. Ops-Zeit. Nach 30 Tagen war klar: Alle Hosts können Hermes tragen – aber nur einer lieferte die Kombination aus stabiler Erinnerungsqualität und geringem babysitting, die Teams für einen Pilot akzeptieren.

Der Vergleich bewusst ohne gekauften Mac Mini zu Hause als vierte Spur im Haupttext: CapEx und Heim-ISP sind ein anderes Finanzmodell (im Matrix-Abschnitt kurz ergänzt). Fokus bleibt auf Wegen, die Entwicklerinnen ohne vierstellige Hardware sofort testen – und auf dem Pfad, der in NUKCLOUD-Konsolen-Runbook auditierbar skaliert.

SCHMERZWo VPS und Pi die Speicher-Kurve brechen

Tag eins bis sieben täuschten auf allen Hosts: Installation, Bot-Pairing, erste Skills – alles grün. Ab Woche zwei zeigte sich, dass Hermes I/O- und CPU-Steal-sensitiv ist, sobald FTS5-Reindex und LLM-Summaries parallel laufen.

Symptom	Linux-VPS (2 vCPU / 4 GB)	Raspberry Pi 5 (8 GB)	Gemieteter Mac Mini M4 (24 GB)
Gateway-Aussetzer	3–5 kurze Hänger/Woche (Nachbar-Last)	2 Ausfälle durch SD-Wear + Wärme	0 dokumentierte Ausfälle
session_search p95	1,8–4,2 s unter Last	2,1–5,0 s (USB-SSD besser als SD)	0,3–0,9 s
Skill-Distillation	2 Jobs >10 min abgebrochen	1 Job OOM bei parallelem Cron	alle Jobs fertig
Ops-Aufwand	Swap-Tuning, Log-Rotation	Kühlung, Filesystem, PSU	Snapshot + launchd-Check

VPS: Günstige Shared-Knoten sind für stateless Web ok; Hermes schreibt kontinuierlich SQLite und Markdown. Nachts lief bei uns ein Provider-Wartungsfenster – Gateway down, Telegram-Queue sichtbar für Nutzer.
Raspberry Pi: ARM64-Python funktioniert, aber thermische Drossel im geschlossenen Regal erhöhte Latenz. SD-Karte als Root: nach Tag 18 spürbarer Jitter; Umzug auf USB-NVMe half, ersetzte aber nicht fehlendes macOS-Tooling für spätere Xcode-Nachbarschaft.
Cloud-Mac: Kein Wundermittel – aber NVMe, dedizierte vCPU-Äquivalente und macOS-launchd passten zum offiziellen Installer-Pfad. Wer zusätzlich GitHub-Agent-Runner auf demselben Mandanten plant, vermeidet einen zweiten Host.
Menschliche Kosten: Pi und VPS fraßen zusammen ~6 h/Woche Ops; der Cloud-Mac ~45 min (Snapshots, Key-Rotation). Für Teams ist das oft teurer als die Mietdifferenz.

Der Schmerz ist nicht „Hermes läuft nicht auf Linux“. Der Schmerz ist unterbrochene Lernkurve: Jeder Gateway-Gap resettet nicht die Dateien, aber verzögert Distillation und lässt Nutzer glauben, der Bot „vergesse“ wieder.

30 TVier Wochen Tagebuch: derselbe Agent, drei Welten

Woche 1 – Bootstrap: Auf dem VPS lief Hermes nach apt-Abhängigkeiten und Python 3.11 in unter 20 Minuten. Pi brauchte einen Abend für aarch64-Wheels und einen aktiven Kühlkörper-Test. Cloud-Mac: One-Liner, hermes doctor, Gateway an – Referenz-Latenz für spätere Wochen. Skill-Count Ende Woche 1: VPS 4, Pi 4, Mac 5 (ein zusätzlicher Skill aus einem längeren Discord-Thread ohne Timeout).

Woche 2 – Erste Erinnerungs-„Aha“-Momente: Alle drei beantworteten „Wie haben wir den Rollout letzten Dienstag dokumentiert?“ korrekt. Unterschied: VPS-Antwort kam nach spürbarem Räuspern (FTS5 unter CPU steal); Pi lieferte Text, aber Cron für das Morgen-Briefing startete 12 Minuten verspätet. Mac lieferte Antwort + aktualisierte MEMORY.md-Zeile in einem Durchgang. Nutzer im Team bewerteten das als „Bot wird schlauer“ – technisch war es weniger Wartezeit bei Recall.

Woche 3 – Wachstum und Wartung: ~/.hermes/ wuchs auf VPS auf ~2,1 GB, Pi ~1,9 GB (USB-SSD), Mac ~2,4 GB inkl. größerer logs/. VPS: manuelles Vacuum von SQLite nötig. Pi: Wärmealarm einmal, Drossel bis 80 °C. Mac: automatisierter Snapshot über Konsole, Wiederherstellungstest am Tag 19 erfolgreich. Skill-Bibliothek: VPS 11, Pi 10, Mac 14 Einträge – nicht nur Menge, Mac-Skills hatten weniger halbfertige Abbrüche.

Woche 4 – Belastung und Urteil: Simulierter Spike: 40 parallele session_search über drei Kanäle. VPS p95 >6 s, zwei Timeouts; Pi OOM-Kill auf Cron-Kindprozess; Mac blieb unter 1,2 s p95. Gesamtkosten 30 Tage (Hardware amortisiert, Strom Pi ~8 EUR, VPS ~12 USD, Cloud-Mac stundenweise ~entspricht 80–120 EUR je nach SKU – Details auf Preisseite): für einen Produktions-Pilot gewann der gemietete Mac bei „Erinnerung pro Euro Ops-Zeit“, nicht beim absolut niedrigsten Listenpreis.

Erkenntnis Woche 4: „Schlauer“ korreliert stärker mit ununterbrochenen Distillation-Zyklen als mit Modellwechsel. Provider tauschten wir nur einmal – Speicherqualität blieb hostdominiert.

DATENZahlen für Review und Finanzierung

GitHub-Signal: Hermes-Agent >160k Stars (Stand Mitte 2026) – hohe Community, aber keine Entschädigung für langsames FTS5 auf überlasteten VPS.
Speichergrenzen: ~2.200 Zeichen pro Skill/Fakt-Eintrag mit Dedup – Planung für tausende Einträge nach 90 Tagen, nicht für Dutzende.
Gateway: 7+ gleichzeitige Chat-Plattformen möglich; Ausfallkosten skalieren mit Kanalzahl, nicht mit CLI-Nutzern.
VPS 30 Tage: ~12–40 USD + ~6 h Ops; geeignet für persönlichen Bot mit tolerierbaren Lücken.
Pi 30 Tage: ~120–180 EUR einmalig (Board, NVMe, Gehäuse, PSU) + Strom; geeignet für Heimlabor mit technischer Neugier.
Cloud-Mac 30 Tage: variable Miete, ~<1 h Ops/Woche; geeignet für Team-Pilot, Compliance, Co-Tenancy mit CI (Swift-6-Gates).
Recall-Qualität (subjektiv, n=5 Reviewer): Mac 4,6/5, Pi 3,4/5, VPS 3,1/5 nach Tag 30 – korreliert mit p95 session_search und Ausfallzahl.

03Sechs Schritte: 30-Tage-Pilot auf gemietetem Mac Mini M4

Wer nach dem Vergleich den Cloud-Mac-Pfad wählt, kann VPS/Pi als Dev-Sandboxes behalten und einen produktiven Knoten fokussieren. Runbook an Konsole und Bestellflow gekoppelt:

01
SKU und Region: 24 GB RAM, ≥200 GB persistentes Volume für wachsendes state.db. Bestellung über Bestellen; Region nah am Telegram-Webhook-Egress.
02
Baseline und Migration: Zeitzone, Schlaf aus, dedizierter Unix-User. Von VPS/Pi: rsync -a ~/.hermes/ – Pfade in Gateway-Config prüfen.
03
Installieren und pinnen: Release-Tag fixieren; wöchentliches hermes doctor vor Upstream-Sprüngen.
04
30-Tage-Metriken definieren: Skill-Count, DB-Größe, p95 session_search, Gateway-Uptime – wöchentlich in Spreadsheet; Tag-0-Snapshot als Referenz.
05
launchd + Monitoring: Gateway auto-restart; Disk-Alarm bei 80 %; Bot-Tokens außerhalb Git.
06
Tag-30-Entscheid: CapEx Mini vs. Weiter-Miete vs. Hybrid (Mac prod, Pi lab). FinOps mit Hilfe-Center und Preismodell abstimmen.

Hermes Agent Installation (macOS-Produktionspfad)

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
hermes --version
hermes doctor
hermes tui

04Matrix: VPS vs. Raspberry Pi vs. Cloud-Mac M4

Dimension	Linux-VPS	Raspberry Pi 5	NUKCLOUD Mac Mini M4 (Miete)
30-Tage-Gedächtnisqualität	ok mit Lücken	ok mit Thermik/I/O-Risiko	beste Stabilität im Test
7×24 ohne Babysitting	mittel (Provider, steal)	niedrig–mittel (HW)	hoch (DC, launchd)
Apple/Metal-Nachbar	nein	nein	ja (ds4, Ollama)
Einstieg CapEx	sehr niedrig	mittel (Board+SSD)	niedrig (Miete)
Team-Audit	schwach auf Shared	Heimnetz	Mandant, SSH, Region
Empfehlung	Solo, tolerant	Tinkerer, Lab	Pilot → Produktion

Ein gekaufter Mac Mini zu Hause schneidet bei Gedächtnis oft ähnlich gut ab wie der Cloud-Mac – scheitert aber häufig an ISP, Strom und fehlendem Audit. Für 30-Tage-Entscheidungen zählt deshalb: Wie viele Unterbrechungen hattet ihr – und was kostet die nächste?

05Häufige Fragen

Reicht ein 5-USD-VPS für 30 Tage Hermes?

Für einen persönlichen Bot mit wenigen Kanälen oft ja. Sobald FTS5, Cron und Multi-Channel-Gateway parallel laufen, werden Aussetzer zur Erinnerungs-Lücke. Planen Sie Swap, SSD-Volume und realistische Ops – oder migrieren Sie Woche 3 auf einen stabileren Host.

Ist Raspberry Pi 5 der günstige Mac-Ersatz?

Als Lernplattform ja; als ruhiger Produktions-Agent nur mit NVMe, Kühlung und akzeptiertem Thermik-Risiko. Hermes läuft auf ARM64, aber Metal, Xcode und viele macOS-Runbooks fehlen.

Warum nach 30 Tagen trotzdem Cloud-Mac mieten?

Wenn Recall-Latenz, Ausfallzahl und Ops-Stunden im Pilot schlechter sind als die Mietdifferenz – oder wenn Compliance und Team-Sharing zählen. Dann ist Miete keine Luxusline, sondern Versicherung für die Speicher-Kurve.

Kann ich vom Pi/VPS auf NUKCLOUD umziehen ohne Gedächtnisverlust?

Ja, mit rsync des gesamten ~/.hermes/-Baums und kontrolliertem Gateway-Cutover. Testen Sie nach Migration session_search und einen Skill-Reload.

Wo starte ich technisch?

Architektur: Hermes Dreischicht-Speicher. Bestellung: Bestellen, Preise: Preise, Betrieb: Hilfe.