Article
GitHub: Token-Effizienz bei Agentic Workflows
GitHub zeigt, wie Agenten-Workflows ihre eigenen Token-Kosten optimieren können – mit einem Daily Token Auditor und Optimizer, die sich gegenseitig verbessern.
Das Problem
Agentic Workflows, die bei jedem Pull Request laufen, können unbemerkt hohe API-Kosten verursachen. Sie laufen automatisch, stapeln sich über Zeit und verbrennen Tokens im Hintergrund. Im Gegensatz zu interaktiven Sessions ist der Workflow in YAML definiert und wiederholt sich – ideal für Optimierung.
Die Lösung
GitHub hat zwei wichtige Workflows gebaut:
- Daily Token Usage Auditor: Liest Token-Usage-Artefakte, aggregiert Verbrauch nach Workflow und erstellt strukturierte Reports
- Daily Token Optimizer: Analysiert ineffiziente Workflows und erstellt GitHub Issues mit konkreten Verbesserungsvorschlägen
Beide sind selbst agentic Workflows – sie überwachen sich also selbst und verbessern rekursiv.
Haupterkenntnisse
MCP Tools entfernen
Die häufigste Ineffizienz: Unbenutzte MCP-Tools im Manifest. Ein GitHub MCP Server mit 40 Tools bläht jeden Request um 10-15 KB auf. Wenn der Agent nur 2 Tools nutzt, sind die restlichen 38 purer Overhead.
Ergebnis: Entfernen ungenutzer Tools spart 8-12 KB pro Call – mehrere tausend Tokens pro Run.
GitHub MCP durch CLI ersetzen
Statt MCP für Datenabfragen zu nutzen, greifen die optimierten Workflows auf GitHub CLI zurück:
- Pre-agentic Downloads: PR-Diffs und Dateilisten werden vor dem Agent-Start heruntergeladen
- In-agent CLI Proxy: Für dynamische Abfragen proxyt der Workflow CLI-Traffic ohne Token-Exposure
Das nimmt Daten aus dem LLM-Reasoning-Loop heraus.
Effective Tokens Metrik
Nicht alle Tokens sind gleich. GitHub nutzt eine gewichtete Formel:
- Model-Kosten Multiplikator (Haiku=0.25x, Sonnet=1.0x, Opus=5.0x)
- Input-Tokens = 1.0x Gewicht
- Cache-Read-Tokens = 0.1x (billiger)
- Output-Tokens = 4.0x (teuerster Faktor)
Ergebnisse
- Auto-Triage Issues: -62% Tokens über 109 Runs
- Security Guard: -43% (PR-Security-Check)
- Smoke Claude: -59% (incl. Modell-Wechsel zu Haiku)
Wichtig: Laufzeit-Frequenz ist entscheidend. Ein Workflow mit 6.8 Runs/Tag und 62% Ersparnis spart schnell Millionen Tokens.
Fazit
Wer agentic Workflows in CI betreibt, sollte Token-Monitoring von Tag 1 an einbauen – nicht erst nachträglich. Die Tools sind im gh-aw Extension verfügbar.