Article
Token-Effizienz bei GitHub-Agenten: So senken Entwickler ihre API-Kosten
GitHub Agentic Workflows werden automatisch bei jedem Pull Request ausgeführt und können still Kosten ansammeln. Ein Team hat ihre eigenen Workflows systematisch optimiert und teilt dabei wertvolle Erkenntnisse über Token-Effizienz bei KI-Agenten. Da diese Workflows als GitHub Actions laufen, summieren sich API-Kosten schnell, ohne dass Entwickler es merken.
Die Lösung war dreistufig: Zuerst wurde die Token-Nutzung durch eine API-Proxy-Schicht protokolliert, die alle Agenten-Frameworks (Claude CLI, Copilot CLI, Codex CLI) einheitlich erfasst. Jeder Workflow gibt nun eine token-usage.jsonl-Datei aus mit Input-Tokens, Output-Tokens und Cache-Statistiken.
Der wichtigste Fund: Ungenutzte MCP-Tools fressen Tokens. Ein GitHub MCP Server mit 40 Tools kann 10-15 KB Schema pro Request hinzufügen. Wenn ein Agent nur zwei davon nutzt, sind die anderen 38 reine Verschwendung. Das Entfernen ungenutzter Tools reduzierte die Kontext-Größe um 8-12 KB pro Call. Ein Daily Token Optimizer Agent schlägt konkrete Verbesserungen vor, während ein Auditor auffällige Workflows identifiziert.