Article

Tokenomics: Wo Tokens in Agentic Software Engineering konsumiert werden

June 07, 2026 LLM Multi-Agent Token-Optimization Research

Ein neues Forschungspaper von arXiv quantifiziert erstmals systematisch, wo genau Tokens in Multi-Agent-Software-Entwicklungssystemen verbraucht werden. Die Studie analysiert 30 Software-Entwicklungsaufgaben im ChatDev-Framework mit einem GPT-5 Reasoning Model.

Das überraschende Ergebnis: Code Review verschlingt durchschnittlich 59.4% aller Tokens - nicht die initiale Code-Generierung, sondern die iterative Refinement- und Verifikationsphase. Input-Tokens machen konstant 53.9% des Verbrauchs aus, was auf signifikante Ineffizienzen in der agenten-basierten Kollaboration hindeutet.

Die Forscher kartierten sechs SDLC-Phasen: Design, Coding, Code Completion, Code Review, Testing und Documentation. Die Metrik deckt eklatante Kostentreiber auf - jeder Agent muss den vollen Kontext lesen, bevor er reagiert, während Code Review Multiple Iterations durchläuft.

Die Implikation ist klar: Wer Multi-Agent-Systeme praktisch einsetzen will, muss nicht die Code-Generierung optimieren, sondern die Verifikations- und Kommunikationsprotokolle. Token-efficient Agent Collaboration wird zum neuen Forschungsfeld. Die empirische Datenbasis erlaubt erstmals präzise Kostenvorhersagen und Workflow-Optimierungen.

Link: arXiv:2601.14470