Hermes Agent Skills Fortgeschritten 2026: SKILL.md, Bundles und GEPA-Selbstevolution

00Warum Hermes Skills eine eigene Tiefenanalyse verdienen

Anfang 2026 brachte NousResearch Hermes Agent heraus. Innerhalb von zwei Monaten 160.000 GitHub-Stars — eines der am schnellsten wachsenden Open-Source-Projekte im Agenten-Bereich. Das Alleinstellungsmerkmal ist nicht ein größeres Modell, sondern die Philosophie: „the agent that grows with you."

Die technische Basis dieses Wachstums ist das Skills-System. Im Gegensatz zu Einmal-Prompts sind Hermes-Skills standardisiertes, evolvierbares, sitzungsübergreifendes prozedurales Gedächtnis. Dieser Beitrag überspringt Installationsgrundlagen und geht direkt in die Tiefe: Progressive Disclosure für Token-Kontrolle, Conditional Activation für kontextbewusstes Verhalten, Skill Bundles für Ein-Befehl-Workflows, DSPy + GEPA für automatisch verbessernde Skills und die besten Open-Source-Skill-Repositories zum direkten Tap.

PainWas schiefgeht, wenn Skills wie lange Prompts behandelt werden

Token-Verschwendung durch Eager Loading: Vollständige SOPs in jede Sitzung zu laden, verbrennt Kontext, bevor der Agent eine Aufgabe wählt. Skills sind für On-Demand-Laden gebaut.
Vage Beschreibungen, falsche Aktivierung: „Hilft bei Code" lädt in irrelevanten Kontexten. Präzision im description-Feld ist Ihr Level-0-Filter.
Kein Workflow-Packaging: Teams rufen fünf Slash-Befehle manuell auf — statt einem Bundle für Code Review, TDD, PR-Workflow und Debugging.
Veraltete Skills nach Edits: SKILL.md-Änderungen greifen mid-session nicht — erst /reset oder --now, was Prompt-Cache invalidiert.
Skills und MCP verwechselt: MCP liefert Werkzeuge; Skills lehren, wie man sie nutzt. Ohne Skills ruft der Agent Datenbank-MCP-Tools ohne Migrations-Playbook auf.

01Skills vs. Memory vs. Prompts: Das Konzept-Schema

Drei Kontextschichten sehen ähnlich aus, verhalten sich aber unterschiedlich. Nutzen Sie diese Matrix, bevor Sie Ihre erste SKILL.md schreiben.

Dimension	Prompt	Memory	Skill
Persistenz	Aktuelle Konversation	Sitzungsübergreifend, permanent	Sitzungsübergreifend, permanent
Ladezeitpunkt	Immer im Kontext	Pro Sitzung injiziert	On Demand (Schlüsseldifferenz)
Token-Kosten	Jeder Turn	Klein, stabil	Null bis Aktivierung
Inhaltstyp	Beliebige Absicht	Präferenzen / Fakten	Prozedurale Schritte
Pflege durch	Nutzer manuell	Agent automatisch	Nutzer + Agent
Teilbar	Unbequem	Privat	Als Community-Tap publizierbar

Eselsbrücke: Prompt = Post-it (nur diese Sitzung). Memory = Notizblock (immer griffbereit). Skill = SOP-Handbuch (bei Bedarf aufschlagen).

02SKILL.md-Format und Progressive Disclosure

Alle Hermes-Skills folgen dem offenen Standard agentskills.io — portabel zwischen Hermes, Claude Code, Cursor und OpenCode. Validieren Sie mit skills-ref validate ./my-skill vor der Veröffentlichung.

SKILL.md Frontmatter + Body-Skelett

---
name: my-skill
description: |
  Use when the user needs to [...].
  Handles [...] and [...].
version: 1.0.0
license: MIT
compatibility: Requires git, docker
allowed-tools: Bash(git:*) Read
metadata:
  hermes:
    tags: [devops, automation]
    category: software-development
    related_skills: [github-pr-workflow, test-driven-development]
    requires_toolsets: [terminal]
    fallback_for_toolsets: [web]
---

# My Skill Title

## Overview
Was der Skill tut und warum er existiert.

## When to Use
- Use for: [spezifische Szenarien]
- Don't use for: [ausgeschlossene Szenarien]

## Procedure
1. Schritt eins (exakte Befehle)
2. Schritt zwei
3. Schritt drei

## Common Pitfalls
1. Fehlermodus + Fix
2. Grenzfall-Behandlung

## Verification Checklist
- [ ] Prüfpunkt 1
- [ ] Prüfpunkt 2

Verzeichnislayout für modulare Skills:

~/.hermes/skills/my-category/my-skill/

├── SKILL.md              # Kernschritte (Ziel ≤500 Zeilen)
├── references/
│   ├── api-docs.md       # On-Demand geladen
│   └── examples.md
├── templates/
│   └── config.yaml
└── scripts/
    └── setup.sh          # Agent-ausführbar

Progressive Disclosure ist der Token-Kontrollkern. Drei Ladestufen:

Stufe	Inhalt	Trigger	Token-Kosten
Level 0	`name` + `description`	Jeder Sitzungsstart (alle Skills)	~3K gesamt im Katalog
Level 1	Vollständiger `SKILL.md`-Body	`/skill-name` oder LLM-Entscheidung	Abhängig von Dateilänge
Level 2	`references/`, `scripts/`	LLM während Ausführung	Pro Datei, on demand

Das description-Feld ist die gesamte Level-0-Information. Schreiben Sie wann nutzen klarer als was es ist — das LLM entscheidet danach, ob der vollständige Skill geladen wird.

03Skill Bundles: Ein Befehl für den gesamten Workflow

Skill Bundles sind ein 2026-Feature, das noch untergenutzt wird. Ein Bundle ist eine leichte YAML-Datei, die mehrere Skills in einen Slash-Befehl packt. /bundle-name lädt alle gelisteten Skills gleichzeitig.

Speicherort: ~/.hermes/skill-bundles/<slug>.yaml

backend-dev.yaml

name: backend-dev
description: |
  Full backend feature workflow — code review, TDD, and PR management.
  Use at the start of any new backend feature session.
skills:
  - github-code-review
  - test-driven-development
  - github-pr-workflow
instruction: |
  Always write failing tests first before implementation.
  Open PRs with co-author tags for pair-programming sessions.
  Never push directly to main.

Research-Session-Bundle:

research-session.yaml

name: research-session
description: Load all research tools at once for deep-dive sessions.
skills:
  - arxiv
  - deep-research
  - plan
  - excalidraw
instruction: |
  Start every session by checking recent papers on the topic.
  Create an Excalidraw diagram for any architecture discussed.

MLOps-Deploy-Pipeline:

mlops-deploy.yaml

name: mlops-deploy
description: Model deployment pipeline with monitoring setup.
skills:
  - vllm
  - llama-cpp
  - github-pr-workflow
  - systematic-debugging
instruction: |
  Always run inference benchmarks before and after deployment.
  Document model quantization settings in PR description.

Prioritätsregeln: Bundle schlägt gleichnamigen Skill. Fehlende Skills werden übersprungen mit Warnung, nicht mit Fehler. Bundles ändern den System-Prompt nicht — Prompt-Cache bleibt gültig.

CLI-Schnellerstellung

hermes bundles create backend-dev \
  --skills github-code-review,test-driven-development,github-pr-workflow \
  --instruction "Always write failing tests first"

04Conditional Activation: Kontextbewusste Skills

Skills können sich automatisch ein- oder ausblenden, je nachdem welche Tools in der aktuellen Sitzung verfügbar sind. Konfiguration unter metadata.hermes:

Aktivierungsregeln in SKILL.md

metadata:
  hermes:
    requires_toolsets: [web]
    requires_tools: [web_search]
    fallback_for_toolsets: [browser]
    fallback_for_tools: [browser_navigate]

Feld	Verhalten
`requires_toolsets`	Skill ausblenden, wenn Toolsets fehlen
`requires_tools`	Skill ausblenden, wenn Tools fehlen
`fallback_for_toolsets`	Skill ausblenden, wenn Toolsets vorhanden (Fallback-Rolle)
`fallback_for_tools`	Skill ausblenden, wenn Tools vorhanden

Gratis vs. kostenpflichtige Suche: DuckDuckGo-Skill setzt fallback_for_tools: [web_search]. Mit FIRECRAWL_KEY oder BRAVE_SEARCH_KEY aktiviert sich kostenpflichtiges web_search — DuckDuckGo verschwindet aus dem Prompt und spart Tokens. Ohne API taucht der Fallback automatisch auf.

Plattformbewusste Skills: requires_toolsets: [messaging] mit platforms: [telegram, discord]. Die hermes skills-TUI erlaubt unabhängiges Ein-/Ausschalten pro Plattform (CLI, Telegram, Discord).

05Skills Hub und Open-Source-Ökosystem

Offizielle Installationskanäle:

hermes skills install

hermes skills install official/research/arxiv
hermes skills install https://example.com/SKILL.md --name my-skill
hermes skills install github:openai/skills/k8s
hermes skills tap add github:my-org/my-skills

Repository	Fokus	Stars	Highlight
awesome-hermes-skills	Produktionsreife Kuratierung	67	Deep Research, MLOps, Apple-Integration; gh-copilot-Plugin
hermeshub	Community-Registry + Security Scan	166	API und Marktplatz; Prompt-Injection-Prüfung pro Skill
ai-agent-skills	191 Skills, 28 Kategorien	10	Cross-Agent-Install für Hermes / Claude Code / Cursor
hermes-agent	Offizielle Quelle	—	Built-in Skills und Authoring-Spec

agentskills.io bedeutet: Skills sind nicht an einen Host gebunden. Community-Assets reisen mit.

06Eigenen Skill Tap veröffentlichen

Ein GitHub-Repo als Tap lässt Ihr ganzes Team — oder die Community — Ihr Skill-Set abonnieren.

my-skills-tap/ Layout

my-skills-tap/
├── skills.sh.json
├── mlops/
│   ├── vllm-deploy/SKILL.md
│   └── model-benchmark/SKILL.md
├── research/
│   ├── paper-summarizer/SKILL.md
│   └── citation-finder/SKILL.md
└── README.md

skills.sh.json (Hub-Gruppierungen)

{
  "groupings": [
    {
      "title": "MLOps & Model Deployment",
      "skills": ["vllm-deploy", "model-benchmark"]
    },
    {
      "title": "AI Research Workflows",
      "skills": ["paper-summarizer", "citation-finder"]
    }
  ]
}

Team-Deployment

hermes skills tap add github:your-org/your-skills-tap
hermes skills tap add github:your-org/private-skills --token $GH_TOKEN
hermes skills tap update
hermes skills tap list

Versionskontrolle: Tracken Sie ~/.hermes/skills/ in Git für geräteübergreifende Sync. Nach git pull führt hermes skills reset den Rebuild der Built-ins aus.

07Selbstevolvierende Skills mit GEPA + DSPy

GEPA (Genetic-Pareto Prompt Evolution) ist ICLR-2026-Oral-Arbeit, integriert in hermes-agent-self-evolution. Es verbessert Skill-Text — nicht Modellgewichte — durch Analyse von Ausführungstraces, Variantengenerierung und multi-objektive Pareto-Optimierung.

Kosten: etwa 2–10 USD pro Optimierungslauf (nur API-Aufrufe, keine GPU).

Fünf-Stufen-Evolutionspipeline:

Stufe 1 — Trace-Sammlung: Vollständige Reasoning-Traces aus SQLite lesen (Tool-Aufrufe, Verzweigungen, Fehler).
Stufe 2 — Reflektive Fehleranalyse: LLM erzeugt umsetzbare Nebeninformation — nicht „es ist fehlgeschlagen", sondern warum.
Stufe 3 — Gezielte Mutation: 10–20 SKILL.md-Varianten zu Root Causes generieren.
Stufe 4 — Multi-objektive Pareto-Bewertung: Erfolgsrate × Token-Effizienz × Geschwindigkeit gleichzeitig optimieren.
Stufe 5 — Menschlicher PR-Review: Beste Variante wird PR; erst nach Freigabe live.

evolve_skill Quick Start

git clone https://github.com/NousResearch/hermes-agent-self-evolution
cd hermes-agent-self-evolution && pip install -r requirements.txt
export HERMES_AGENT_PATH=~/.hermes

python -m evolution.skills.evolve_skill \
    --skill github-code-review \
    --iterations 10 \
    --eval-source synthetic

python -m evolution.skills.evolve_skill \
    --skill github-code-review \
    --iterations 10 \
    --eval-source sessiondb

Vier Guardrails vor jedem PR:

Volle Testsuite: pytest tests/ -q muss 100 % bestehen
Größenlimit: Skills ≤ 15 KB, Tool-Beschreibungen ≤ 500 Zeichen
Prompt-Cache-Kompatibilität: keine Mid-Session-Edits, die Cache invalidieren
Semantische Erhaltung: evolvierte Texte dürfen nicht vom Kernzweck abdriften

Phase	Ziel	Engine	Status
Phase 1	SKILL.md-Dateien	DSPy + GEPA	Verfügbar
Phase 2	Tool-Beschreibungen	DSPy + GEPA	Geplant
Phase 3	System-Prompt-Fragmente	DSPy + GEPA	Geplant
Phase 4	Tool-Implementierungscode	Darwinian Evolver	Geplant
Phase 5	Kontinuierliche Verbesserungsschleife	Automatisierte Pipeline	Geplant

Cross-Host-Traces: Weil Skills agentskills.io folgen, können Claude-Code- oder Gemini-CLI-Traces in GEPA einfließen:

Gemischte Trace-Quellen (experimentell)

python -m evolution.skills.evolve_skill \
    --skill github-code-review \
    --iterations 10 \
    --eval-source mixed \
    --trace-dirs ~/.claude/traces,~/.hermes/sessions

08Plugin-gebündelte Skills

Plugins namespacen Skills als plugin:skill:

Skills erscheinen nicht in der Standard-skills_list (weniger System-Prompt-Rauschen)
Aktivierung nur bei explizitem Nutzeraufruf (Opt-in)
Geschwister-Skills innerhalb eines Plugins sind gegenseitig sichtbar

Plugin-Skill laden

skill_view("superpowers:writing-plans")

Agent-Antwort enthält Geschwister-Skills: „This plugin also includes: superpowers:editing, superpowers:research".

plugin.yaml Skill-Deklaration

name: my-hermes-plugin
skills:
  - name: writing-plans
    path: skills/writing-plans/SKILL.md
  - name: editing
    path: skills/editing/SKILL.md

09Fortgeschrittene Authoring-Tipps

Beschreibungspräzision steuert Aktivierung:

Schlecht vs. gut

description: Helps with code.

description: |
  Use when reviewing a pull request, checking for code quality issues,
  security vulnerabilities, or style violations. Handles GitHub PR URLs
  and local git diff output. Do NOT use for writing new code.

Der Pitfalls-Abschnitt trennt gute von exzellenten Skills: konkrete Fehlermuster, Root-Cause-Analyse, umsetzbare Fixes — keine generischen Warnungen.

Skripte geben Skills echter Ausführungskraft. Referenzieren Sie scripts/extract_schema.py in Procedure; bei Fehler laden Sie references/manual-extract.md als Fallback.

Skill-Größe	Empfehlung
< 500 Zeilen	Alles in SKILL.md
500–1000 Zeilen	Referenzmaterial nach `references/`
> 1000 Zeilen	Aggressiv splitten; ggf. zwei Skills
> 15 KB	GEPA-Limit überschritten — muss gesplittet werden

skill_manage erlaubt dem Agenten, Skills programmatisch zu patchen oder anzulegen. Approval Gate in config.yaml: skills.agent_writes_require_approval: true.

10Fallstudie: Tech-Blog-Workflow-Skills

Ziel: ein vollständiger Blog-Schreib-Assistenten-Stack für Hermes.

~/.hermes/skill-bundles/blog-workflow.yaml

name: blog-workflow
description: Full tech blog writing workflow.
skills:
  - seo-keyword-research
  - outline-generator
  - code-example-validator
  - bilingual-checker
  - publish-to-platform
instruction: |
  Always research SEO keywords before writing.
  Ensure all code examples are tested and runnable.
  Generate both Chinese and English title options.

seo-keyword-research/SKILL.md (Auszug)

---
name: seo-keyword-research
description: |
  Use when planning a technical blog post. Researches search volume,
  competition, and related queries for Chinese and English audiences.
metadata:
  hermes:
    requires_toolsets: [web]
    tags: [seo, blogging, content]
---

## Procedure
1. Identify primary topic from user or context
2. Chinese long-tail: "X 怎么用", "X 教程", "X 最佳实践"
3. English long-tail: "X tutorial", "how to X", "X vs Y"
4. Cross-reference platform trends (掘金, Dev.to, HN)
5. Output keyword matrix: 3-5 primary + 10-15 long-tail per language

/blog-workflow am Sitzungsstart: Der Agent recherchiert Keywords, erstellt Outlines, validiert Codebeispiele und bereitet zweisprachige Titel vor, bevor Sie einen Absatz schreiben.

11Sechs-Schritte-Runbook: Skills-Labor auf Cloud-Mac

01
Hermes und Baseline-Skills installieren: Folgen Sie unserer Installationsanleitung. Fügen Sie offizielle Taps und mindestens ein Community-Repo hinzu (hermes skills tap add github:ChuckSRQ/awesome-hermes-skills). Prüfen Sie mit hermes skills list, dass der Level-0-Katalog unter ~3K Tokens bleibt.
02
Dedizierten Cloud-Mac bereitstellen: Öffnen Sie die NUKCLOUD-Konsole und wählen Sie eine Stufe mit 16 GB+ (32 GB bei paralleler GEPA-Evolution). Stundenabrechnung auf der Preisseite eignet sich für Skill-Authoring-Piloten.
03
SKILL.md-Dateien schreiben und validieren: Skills unter ~/.hermes/skills/ nach agentskills.io anlegen. skills-ref validate ./my-skill ausführen. Präzise description-Felder schreiben; Dateien über 500 Zeilen nach references/ auslagern.
04
Bundles und Conditional Activation paketieren: YAML-Bundles für wiederkehrende Workflows anlegen. fallback_for_tools für Gratis/Kostenpflicht-Tool-Wechsel setzen. Mit /bundle-name testen; fehlende Skills sollen warnen, nicht abstürzen.
05
Team-Tap veröffentlichen und GEPA-Evolution fahren: Skills in GitHub-Tap pushen; Teammitglieder hermes skills tap add. hermes-agent-self-evolution klonen, HERMES_AGENT_PATH setzen, einen Skill mit --eval-source sessiondb evolvieren (Budget 2–10 USD pro Lauf). PR-Diffs vor Merge prüfen.
06
Daemonisieren und Kapazität sichern: ~/.hermes/skills/ in Git tracken; launchd für 24/7 Hermes-Gateway oder Telegram-Bot. Stufe auf der Bestellseite fixieren. Parallel lesen: Cursor-Skills-Muster, wenn Ihr Team IDE und Terminal-Agenten trennt.

Hermes-Skills auf einem Laptop scheitern an Deckel-zu-Sleep, der Telegram-Sitzungen killt, geteilter VPS-Bandbreite, die lange Agent-Loops unterbricht, und Prompt-Cache-Invalidierung bei Mid-Flight-Edits. GEPA-Evolution und nächtliche Agent-Läufe brauchen eine Maschine, die wach bleibt. Für produktionsreife Skill-Labs und Team-Taps liefern NUKCLOUD Multi-Region Bare-Metal Mac / Cloud-Mac-Knoten Mandantenisolation und Spez-Elastizität — stundenweise starten, monatlich fixieren, wenn der Skill-Katalog stabil ist.

12Häufig gestellte Fragen

Worin unterscheiden sich Skills von MCP?

Skills sind prozedurale Wissensdokumente, die einem Agenten beibringen, etwas zu tun. MCP ist eine Tool-Schnittstelle mit zusätzlichen aufrufbaren Fähigkeiten. Sie ergänzen sich: Ein MCP-Server liefert Datenbankzugriff; ein Skill lehrt sichere Migration damit.

Warum verhält sich mein editierter Skill noch wie die alte Version?

Skill-Edits gelten nicht mid-session. /reset für neue Sitzung oder Neuinstallation mit --now. Der --now-Weg invalidiert Prompt-Cache und kostet mehr Tokens — bevorzugen Sie /reset.

Sind GEPA-evolvierte Skills sicher deploybar?

Vier Guardrails: voller pytest-Durchlauf, 15-KB-Größenlimit, Prompt-Cache-Kompatibilität und semantische Erhaltung. Jede Variante landet als PR mit menschlichem Review. Behandeln Sie Diffs wie Code-Änderungen.

Kann ich Hermes-Skills in Claude Code wiederverwenden?

SKILL.md-Dateien nach ~/.claude/skills/ kopieren oder kevinnft/ai-agent-skills für Multi-Agent-Install nutzen. Das agentskills.io-Format ist absichtlich portabel.

Beeinträchtigt chinesischer Skill-Inhalt die Token-Effizienz?

Chinesische Zeichen kosten in den meisten Tokenizern etwa 1–1,5 Tokens pro Zeichen — ähnlich wie Englisch. Halten Sie description auf Englisch (oder zweisprachig) für präziseres Level-0-Matching; Body-Inhalt kann jede Sprache sein.

13Weiterführende Ressourcen

Offizielle Dokumentation:

Open-Source-Repositories:

Community-Inhalte: