Hermes Agent Skills Fortgeschritten 2026: SKILL.md, Bundles und GEPA-Selbstevolution

Im Juni 2026 hat Hermes Agent 160.000 GitHub-Stars erreicht — nicht wegen Modellgröße, sondern wegen einer Idee: „the agent that grows with you." Das Herzstück ist das Skills-System: standardisiertes, sitzungsübergreifendes prozedurales Gedächtnis mit Progressive Disclosure, Skill Bundles, Conditional Activation und GEPA + DSPy zur automatischen Verbesserung ohne Gewichtsanpassung.

Sie haben Hermes installiert, ein paar Prompts geschrieben — und der Agent vergisst Ihren Workflow bei jeder neuen Sitzung. Die Lösung ist kein längerer System-Prompt, sondern Skills: sitzungsübergreifendes prozedurales Gedächtnis mit null Token-Kosten bis zur Aktivierung. Dieser Artikel richtet sich an Entwickler, die Hermes (oder Cursor / Claude Code mit SKILL.md) bereits betreiben und produktionsreife Muster wollen. Sie lernen: (1) Skills vs. Memory vs. Prompts einordnen; (2) das agentskills.io-Format und dreistufige Progressive Disclosure; (3) Bundles, Conditional Activation und Team-Taps ausliefern; (4) GEPA-Selbstevolution auf echten Traces fahren; (5) ein stabiles Skills-Labor auf NUKCLOUD Cloud-Mac betreiben. Noch nicht installiert? Starten Sie mit unserer Installationsanleitung und dem Cursor Agent Skills Guide.

00Warum Hermes Skills eine eigene Tiefenanalyse verdienen

Anfang 2026 brachte NousResearch Hermes Agent heraus. Innerhalb von zwei Monaten 160.000 GitHub-Stars — eines der am schnellsten wachsenden Open-Source-Projekte im Agenten-Bereich. Das Alleinstellungsmerkmal ist nicht ein größeres Modell, sondern die Philosophie: „the agent that grows with you."

Die technische Basis dieses Wachstums ist das Skills-System. Im Gegensatz zu Einmal-Prompts sind Hermes-Skills standardisiertes, evolvierbares, sitzungsübergreifendes prozedurales Gedächtnis. Dieser Beitrag überspringt Installationsgrundlagen und geht direkt in die Tiefe: Progressive Disclosure für Token-Kontrolle, Conditional Activation für kontextbewusstes Verhalten, Skill Bundles für Ein-Befehl-Workflows, DSPy + GEPA für automatisch verbessernde Skills und die besten Open-Source-Skill-Repositories zum direkten Tap.

PainWas schiefgeht, wenn Skills wie lange Prompts behandelt werden

  • Token-Verschwendung durch Eager Loading: Vollständige SOPs in jede Sitzung zu laden, verbrennt Kontext, bevor der Agent eine Aufgabe wählt. Skills sind für On-Demand-Laden gebaut.
  • Vage Beschreibungen, falsche Aktivierung: „Hilft bei Code" lädt in irrelevanten Kontexten. Präzision im description-Feld ist Ihr Level-0-Filter.
  • Kein Workflow-Packaging: Teams rufen fünf Slash-Befehle manuell auf — statt einem Bundle für Code Review, TDD, PR-Workflow und Debugging.
  • Veraltete Skills nach Edits: SKILL.md-Änderungen greifen mid-session nicht — erst /reset oder --now, was Prompt-Cache invalidiert.
  • Skills und MCP verwechselt: MCP liefert Werkzeuge; Skills lehren, wie man sie nutzt. Ohne Skills ruft der Agent Datenbank-MCP-Tools ohne Migrations-Playbook auf.

01Skills vs. Memory vs. Prompts: Das Konzept-Schema

Drei Kontextschichten sehen ähnlich aus, verhalten sich aber unterschiedlich. Nutzen Sie diese Matrix, bevor Sie Ihre erste SKILL.md schreiben.

DimensionPromptMemorySkill
PersistenzAktuelle KonversationSitzungsübergreifend, permanentSitzungsübergreifend, permanent
LadezeitpunktImmer im KontextPro Sitzung injiziertOn Demand (Schlüsseldifferenz)
Token-KostenJeder TurnKlein, stabilNull bis Aktivierung
InhaltstypBeliebige AbsichtPräferenzen / FaktenProzedurale Schritte
Pflege durchNutzer manuellAgent automatischNutzer + Agent
TeilbarUnbequemPrivatAls Community-Tap publizierbar

Eselsbrücke: Prompt = Post-it (nur diese Sitzung). Memory = Notizblock (immer griffbereit). Skill = SOP-Handbuch (bei Bedarf aufschlagen).

02SKILL.md-Format und Progressive Disclosure

Alle Hermes-Skills folgen dem offenen Standard agentskills.io — portabel zwischen Hermes, Claude Code, Cursor und OpenCode. Validieren Sie mit skills-ref validate ./my-skill vor der Veröffentlichung.

SKILL.md Frontmatter + Body-Skelett
---
name: my-skill
description: |
  Use when the user needs to [...].
  Handles [...] and [...].
version: 1.0.0
license: MIT
compatibility: Requires git, docker
allowed-tools: Bash(git:*) Read
metadata:
  hermes:
    tags: [devops, automation]
    category: software-development
    related_skills: [github-pr-workflow, test-driven-development]
    requires_toolsets: [terminal]
    fallback_for_toolsets: [web]
---

# My Skill Title

## Overview
Was der Skill tut und warum er existiert.

## When to Use
- Use for: [spezifische Szenarien]
- Don't use for: [ausgeschlossene Szenarien]

## Procedure
1. Schritt eins (exakte Befehle)
2. Schritt zwei
3. Schritt drei

## Common Pitfalls
1. Fehlermodus + Fix
2. Grenzfall-Behandlung

## Verification Checklist
- [ ] Prüfpunkt 1
- [ ] Prüfpunkt 2

Verzeichnislayout für modulare Skills:

~/.hermes/skills/my-category/my-skill/
├── SKILL.md              # Kernschritte (Ziel ≤500 Zeilen)
├── references/
│   ├── api-docs.md       # On-Demand geladen
│   └── examples.md
├── templates/
│   └── config.yaml
└── scripts/
    └── setup.sh          # Agent-ausführbar

Progressive Disclosure ist der Token-Kontrollkern. Drei Ladestufen:

StufeInhaltTriggerToken-Kosten
Level 0name + descriptionJeder Sitzungsstart (alle Skills)~3K gesamt im Katalog
Level 1Vollständiger SKILL.md-Body/skill-name oder LLM-EntscheidungAbhängig von Dateilänge
Level 2references/, scripts/LLM während AusführungPro Datei, on demand

Das description-Feld ist die gesamte Level-0-Information. Schreiben Sie wann nutzen klarer als was es ist — das LLM entscheidet danach, ob der vollständige Skill geladen wird.

03Skill Bundles: Ein Befehl für den gesamten Workflow

Skill Bundles sind ein 2026-Feature, das noch untergenutzt wird. Ein Bundle ist eine leichte YAML-Datei, die mehrere Skills in einen Slash-Befehl packt. /bundle-name lädt alle gelisteten Skills gleichzeitig.

Speicherort: ~/.hermes/skill-bundles/<slug>.yaml

backend-dev.yaml
name: backend-dev
description: |
  Full backend feature workflow — code review, TDD, and PR management.
  Use at the start of any new backend feature session.
skills:
  - github-code-review
  - test-driven-development
  - github-pr-workflow
instruction: |
  Always write failing tests first before implementation.
  Open PRs with co-author tags for pair-programming sessions.
  Never push directly to main.

Research-Session-Bundle:

research-session.yaml
name: research-session
description: Load all research tools at once for deep-dive sessions.
skills:
  - arxiv
  - deep-research
  - plan
  - excalidraw
instruction: |
  Start every session by checking recent papers on the topic.
  Create an Excalidraw diagram for any architecture discussed.

MLOps-Deploy-Pipeline:

mlops-deploy.yaml
name: mlops-deploy
description: Model deployment pipeline with monitoring setup.
skills:
  - vllm
  - llama-cpp
  - github-pr-workflow
  - systematic-debugging
instruction: |
  Always run inference benchmarks before and after deployment.
  Document model quantization settings in PR description.

Prioritätsregeln: Bundle schlägt gleichnamigen Skill. Fehlende Skills werden übersprungen mit Warnung, nicht mit Fehler. Bundles ändern den System-Prompt nicht — Prompt-Cache bleibt gültig.

CLI-Schnellerstellung
hermes bundles create backend-dev \
  --skills github-code-review,test-driven-development,github-pr-workflow \
  --instruction "Always write failing tests first"

04Conditional Activation: Kontextbewusste Skills

Skills können sich automatisch ein- oder ausblenden, je nachdem welche Tools in der aktuellen Sitzung verfügbar sind. Konfiguration unter metadata.hermes:

Aktivierungsregeln in SKILL.md
metadata:
  hermes:
    requires_toolsets: [web]
    requires_tools: [web_search]
    fallback_for_toolsets: [browser]
    fallback_for_tools: [browser_navigate]
FeldVerhalten
requires_toolsetsSkill ausblenden, wenn Toolsets fehlen
requires_toolsSkill ausblenden, wenn Tools fehlen
fallback_for_toolsetsSkill ausblenden, wenn Toolsets vorhanden (Fallback-Rolle)
fallback_for_toolsSkill ausblenden, wenn Tools vorhanden

Gratis vs. kostenpflichtige Suche: DuckDuckGo-Skill setzt fallback_for_tools: [web_search]. Mit FIRECRAWL_KEY oder BRAVE_SEARCH_KEY aktiviert sich kostenpflichtiges web_search — DuckDuckGo verschwindet aus dem Prompt und spart Tokens. Ohne API taucht der Fallback automatisch auf.

Plattformbewusste Skills: requires_toolsets: [messaging] mit platforms: [telegram, discord]. Die hermes skills-TUI erlaubt unabhängiges Ein-/Ausschalten pro Plattform (CLI, Telegram, Discord).

05Skills Hub und Open-Source-Ökosystem

Offizielle Installationskanäle:

hermes skills install
hermes skills install official/research/arxiv
hermes skills install https://example.com/SKILL.md --name my-skill
hermes skills install github:openai/skills/k8s
hermes skills tap add github:my-org/my-skills
RepositoryFokusStarsHighlight
awesome-hermes-skillsProduktionsreife Kuratierung67Deep Research, MLOps, Apple-Integration; gh-copilot-Plugin
hermeshubCommunity-Registry + Security Scan166API und Marktplatz; Prompt-Injection-Prüfung pro Skill
ai-agent-skills191 Skills, 28 Kategorien10Cross-Agent-Install für Hermes / Claude Code / Cursor
hermes-agentOffizielle QuelleBuilt-in Skills und Authoring-Spec

agentskills.io bedeutet: Skills sind nicht an einen Host gebunden. Community-Assets reisen mit.

06Eigenen Skill Tap veröffentlichen

Ein GitHub-Repo als Tap lässt Ihr ganzes Team — oder die Community — Ihr Skill-Set abonnieren.

my-skills-tap/ Layout
my-skills-tap/
├── skills.sh.json
├── mlops/
│   ├── vllm-deploy/SKILL.md
│   └── model-benchmark/SKILL.md
├── research/
│   ├── paper-summarizer/SKILL.md
│   └── citation-finder/SKILL.md
└── README.md
skills.sh.json (Hub-Gruppierungen)
{
  "groupings": [
    {
      "title": "MLOps & Model Deployment",
      "skills": ["vllm-deploy", "model-benchmark"]
    },
    {
      "title": "AI Research Workflows",
      "skills": ["paper-summarizer", "citation-finder"]
    }
  ]
}
Team-Deployment
hermes skills tap add github:your-org/your-skills-tap
hermes skills tap add github:your-org/private-skills --token $GH_TOKEN
hermes skills tap update
hermes skills tap list

Versionskontrolle: Tracken Sie ~/.hermes/skills/ in Git für geräteübergreifende Sync. Nach git pull führt hermes skills reset den Rebuild der Built-ins aus.

07Selbstevolvierende Skills mit GEPA + DSPy

GEPA (Genetic-Pareto Prompt Evolution) ist ICLR-2026-Oral-Arbeit, integriert in hermes-agent-self-evolution. Es verbessert Skill-Text — nicht Modellgewichte — durch Analyse von Ausführungstraces, Variantengenerierung und multi-objektive Pareto-Optimierung.

Kosten: etwa 2–10 USD pro Optimierungslauf (nur API-Aufrufe, keine GPU).

Fünf-Stufen-Evolutionspipeline:

  1. Stufe 1 — Trace-Sammlung: Vollständige Reasoning-Traces aus SQLite lesen (Tool-Aufrufe, Verzweigungen, Fehler).
  2. Stufe 2 — Reflektive Fehleranalyse: LLM erzeugt umsetzbare Nebeninformation — nicht „es ist fehlgeschlagen", sondern warum.
  3. Stufe 3 — Gezielte Mutation: 10–20 SKILL.md-Varianten zu Root Causes generieren.
  4. Stufe 4 — Multi-objektive Pareto-Bewertung: Erfolgsrate × Token-Effizienz × Geschwindigkeit gleichzeitig optimieren.
  5. Stufe 5 — Menschlicher PR-Review: Beste Variante wird PR; erst nach Freigabe live.
evolve_skill Quick Start
git clone https://github.com/NousResearch/hermes-agent-self-evolution
cd hermes-agent-self-evolution && pip install -r requirements.txt
export HERMES_AGENT_PATH=~/.hermes

python -m evolution.skills.evolve_skill \
    --skill github-code-review \
    --iterations 10 \
    --eval-source synthetic

python -m evolution.skills.evolve_skill \
    --skill github-code-review \
    --iterations 10 \
    --eval-source sessiondb

Vier Guardrails vor jedem PR:

  • Volle Testsuite: pytest tests/ -q muss 100 % bestehen
  • Größenlimit: Skills ≤ 15 KB, Tool-Beschreibungen ≤ 500 Zeichen
  • Prompt-Cache-Kompatibilität: keine Mid-Session-Edits, die Cache invalidieren
  • Semantische Erhaltung: evolvierte Texte dürfen nicht vom Kernzweck abdriften
PhaseZielEngineStatus
Phase 1SKILL.md-DateienDSPy + GEPAVerfügbar
Phase 2Tool-BeschreibungenDSPy + GEPAGeplant
Phase 3System-Prompt-FragmenteDSPy + GEPAGeplant
Phase 4Tool-ImplementierungscodeDarwinian EvolverGeplant
Phase 5Kontinuierliche VerbesserungsschleifeAutomatisierte PipelineGeplant

Cross-Host-Traces: Weil Skills agentskills.io folgen, können Claude-Code- oder Gemini-CLI-Traces in GEPA einfließen:

Gemischte Trace-Quellen (experimentell)
python -m evolution.skills.evolve_skill \
    --skill github-code-review \
    --iterations 10 \
    --eval-source mixed \
    --trace-dirs ~/.claude/traces,~/.hermes/sessions

08Plugin-gebündelte Skills

Plugins namespacen Skills als plugin:skill:

  • Skills erscheinen nicht in der Standard-skills_list (weniger System-Prompt-Rauschen)
  • Aktivierung nur bei explizitem Nutzeraufruf (Opt-in)
  • Geschwister-Skills innerhalb eines Plugins sind gegenseitig sichtbar
Plugin-Skill laden
skill_view("superpowers:writing-plans")

Agent-Antwort enthält Geschwister-Skills: „This plugin also includes: superpowers:editing, superpowers:research".

plugin.yaml Skill-Deklaration
name: my-hermes-plugin
skills:
  - name: writing-plans
    path: skills/writing-plans/SKILL.md
  - name: editing
    path: skills/editing/SKILL.md

09Fortgeschrittene Authoring-Tipps

Beschreibungspräzision steuert Aktivierung:

Schlecht vs. gut
description: Helps with code.

description: |
  Use when reviewing a pull request, checking for code quality issues,
  security vulnerabilities, or style violations. Handles GitHub PR URLs
  and local git diff output. Do NOT use for writing new code.

Der Pitfalls-Abschnitt trennt gute von exzellenten Skills: konkrete Fehlermuster, Root-Cause-Analyse, umsetzbare Fixes — keine generischen Warnungen.

Skripte geben Skills echter Ausführungskraft. Referenzieren Sie scripts/extract_schema.py in Procedure; bei Fehler laden Sie references/manual-extract.md als Fallback.

Skill-GrößeEmpfehlung
< 500 ZeilenAlles in SKILL.md
500–1000 ZeilenReferenzmaterial nach references/
> 1000 ZeilenAggressiv splitten; ggf. zwei Skills
> 15 KBGEPA-Limit überschritten — muss gesplittet werden

skill_manage erlaubt dem Agenten, Skills programmatisch zu patchen oder anzulegen. Approval Gate in config.yaml: skills.agent_writes_require_approval: true.

10Fallstudie: Tech-Blog-Workflow-Skills

Ziel: ein vollständiger Blog-Schreib-Assistenten-Stack für Hermes.

~/.hermes/skill-bundles/blog-workflow.yaml
name: blog-workflow
description: Full tech blog writing workflow.
skills:
  - seo-keyword-research
  - outline-generator
  - code-example-validator
  - bilingual-checker
  - publish-to-platform
instruction: |
  Always research SEO keywords before writing.
  Ensure all code examples are tested and runnable.
  Generate both Chinese and English title options.
seo-keyword-research/SKILL.md (Auszug)
---
name: seo-keyword-research
description: |
  Use when planning a technical blog post. Researches search volume,
  competition, and related queries for Chinese and English audiences.
metadata:
  hermes:
    requires_toolsets: [web]
    tags: [seo, blogging, content]
---

## Procedure
1. Identify primary topic from user or context
2. Chinese long-tail: "X 怎么用", "X 教程", "X 最佳实践"
3. English long-tail: "X tutorial", "how to X", "X vs Y"
4. Cross-reference platform trends (掘金, Dev.to, HN)
5. Output keyword matrix: 3-5 primary + 10-15 long-tail per language

/blog-workflow am Sitzungsstart: Der Agent recherchiert Keywords, erstellt Outlines, validiert Codebeispiele und bereitet zweisprachige Titel vor, bevor Sie einen Absatz schreiben.

11Sechs-Schritte-Runbook: Skills-Labor auf Cloud-Mac

  1. 01
    Hermes und Baseline-Skills installieren: Folgen Sie unserer Installationsanleitung. Fügen Sie offizielle Taps und mindestens ein Community-Repo hinzu (hermes skills tap add github:ChuckSRQ/awesome-hermes-skills). Prüfen Sie mit hermes skills list, dass der Level-0-Katalog unter ~3K Tokens bleibt.
  2. 02
    Dedizierten Cloud-Mac bereitstellen: Öffnen Sie die NUKCLOUD-Konsole und wählen Sie eine Stufe mit 16 GB+ (32 GB bei paralleler GEPA-Evolution). Stundenabrechnung auf der Preisseite eignet sich für Skill-Authoring-Piloten.
  3. 03
    SKILL.md-Dateien schreiben und validieren: Skills unter ~/.hermes/skills/ nach agentskills.io anlegen. skills-ref validate ./my-skill ausführen. Präzise description-Felder schreiben; Dateien über 500 Zeilen nach references/ auslagern.
  4. 04
    Bundles und Conditional Activation paketieren: YAML-Bundles für wiederkehrende Workflows anlegen. fallback_for_tools für Gratis/Kostenpflicht-Tool-Wechsel setzen. Mit /bundle-name testen; fehlende Skills sollen warnen, nicht abstürzen.
  5. 05
    Team-Tap veröffentlichen und GEPA-Evolution fahren: Skills in GitHub-Tap pushen; Teammitglieder hermes skills tap add. hermes-agent-self-evolution klonen, HERMES_AGENT_PATH setzen, einen Skill mit --eval-source sessiondb evolvieren (Budget 2–10 USD pro Lauf). PR-Diffs vor Merge prüfen.
  6. 06
    Daemonisieren und Kapazität sichern: ~/.hermes/skills/ in Git tracken; launchd für 24/7 Hermes-Gateway oder Telegram-Bot. Stufe auf der Bestellseite fixieren. Parallel lesen: Cursor-Skills-Muster, wenn Ihr Team IDE und Terminal-Agenten trennt.

Hermes-Skills auf einem Laptop scheitern an Deckel-zu-Sleep, der Telegram-Sitzungen killt, geteilter VPS-Bandbreite, die lange Agent-Loops unterbricht, und Prompt-Cache-Invalidierung bei Mid-Flight-Edits. GEPA-Evolution und nächtliche Agent-Läufe brauchen eine Maschine, die wach bleibt. Für produktionsreife Skill-Labs und Team-Taps liefern NUKCLOUD Multi-Region Bare-Metal Mac / Cloud-Mac-Knoten Mandantenisolation und Spez-Elastizität — stundenweise starten, monatlich fixieren, wenn der Skill-Katalog stabil ist.

12Häufig gestellte Fragen

Worin unterscheiden sich Skills von MCP?
Skills sind prozedurale Wissensdokumente, die einem Agenten beibringen, etwas zu tun. MCP ist eine Tool-Schnittstelle mit zusätzlichen aufrufbaren Fähigkeiten. Sie ergänzen sich: Ein MCP-Server liefert Datenbankzugriff; ein Skill lehrt sichere Migration damit.
Warum verhält sich mein editierter Skill noch wie die alte Version?
Skill-Edits gelten nicht mid-session. /reset für neue Sitzung oder Neuinstallation mit --now. Der --now-Weg invalidiert Prompt-Cache und kostet mehr Tokens — bevorzugen Sie /reset.
Sind GEPA-evolvierte Skills sicher deploybar?
Vier Guardrails: voller pytest-Durchlauf, 15-KB-Größenlimit, Prompt-Cache-Kompatibilität und semantische Erhaltung. Jede Variante landet als PR mit menschlichem Review. Behandeln Sie Diffs wie Code-Änderungen.
Kann ich Hermes-Skills in Claude Code wiederverwenden?
SKILL.md-Dateien nach ~/.claude/skills/ kopieren oder kevinnft/ai-agent-skills für Multi-Agent-Install nutzen. Das agentskills.io-Format ist absichtlich portabel.
Beeinträchtigt chinesischer Skill-Inhalt die Token-Effizienz?
Chinesische Zeichen kosten in den meisten Tokenizern etwa 1–1,5 Tokens pro Zeichen — ähnlich wie Englisch. Halten Sie description auf Englisch (oder zweisprachig) für präziseres Level-0-Matching; Body-Inhalt kann jede Sprache sein.

13Weiterführende Ressourcen

Offizielle Dokumentation:

Open-Source-Repositories:

Community-Inhalte: