Article

GitHub: Token-Effizienz bei Agentic Workflows

github copilot claude agents token-effizienz devops

GitHub zeigt, wie Agenten-Workflows ihre eigenen Token-Kosten optimieren können – mit einem Daily Token Auditor und Optimizer, die sich gegenseitig verbessern.

Das Problem

Agentic Workflows, die bei jedem Pull Request laufen, können unbemerkt hohe API-Kosten verursachen. Sie laufen automatisch, stapeln sich über Zeit und verbrennen Tokens im Hintergrund. Im Gegensatz zu interaktiven Sessions ist der Workflow in YAML definiert und wiederholt sich – ideal für Optimierung.

Die Lösung

GitHub hat zwei wichtige Workflows gebaut:

  1. Daily Token Usage Auditor: Liest Token-Usage-Artefakte, aggregiert Verbrauch nach Workflow und erstellt strukturierte Reports
  2. Daily Token Optimizer: Analysiert ineffiziente Workflows und erstellt GitHub Issues mit konkreten Verbesserungsvorschlägen

Beide sind selbst agentic Workflows – sie überwachen sich also selbst und verbessern rekursiv.

Haupterkenntnisse

MCP Tools entfernen

Die häufigste Ineffizienz: Unbenutzte MCP-Tools im Manifest. Ein GitHub MCP Server mit 40 Tools bläht jeden Request um 10-15 KB auf. Wenn der Agent nur 2 Tools nutzt, sind die restlichen 38 purer Overhead.

Ergebnis: Entfernen ungenutzer Tools spart 8-12 KB pro Call – mehrere tausend Tokens pro Run.

GitHub MCP durch CLI ersetzen

Statt MCP für Datenabfragen zu nutzen, greifen die optimierten Workflows auf GitHub CLI zurück:

  • Pre-agentic Downloads: PR-Diffs und Dateilisten werden vor dem Agent-Start heruntergeladen
  • In-agent CLI Proxy: Für dynamische Abfragen proxyt der Workflow CLI-Traffic ohne Token-Exposure

Das nimmt Daten aus dem LLM-Reasoning-Loop heraus.

Effective Tokens Metrik

Nicht alle Tokens sind gleich. GitHub nutzt eine gewichtete Formel:

  • Model-Kosten Multiplikator (Haiku=0.25x, Sonnet=1.0x, Opus=5.0x)
  • Input-Tokens = 1.0x Gewicht
  • Cache-Read-Tokens = 0.1x (billiger)
  • Output-Tokens = 4.0x (teuerster Faktor)

Ergebnisse

  • Auto-Triage Issues: -62% Tokens über 109 Runs
  • Security Guard: -43% (PR-Security-Check)
  • Smoke Claude: -59% (incl. Modell-Wechsel zu Haiku)

Wichtig: Laufzeit-Frequenz ist entscheidend. Ein Workflow mit 6.8 Runs/Tag und 62% Ersparnis spart schnell Millionen Tokens.

Fazit

Wer agentic Workflows in CI betreibt, sollte Token-Monitoring von Tag 1 an einbauen – nicht erst nachträglich. Die Tools sind im gh-aw Extension verfügbar.

Original: GitHub Blog