Article
Agent-generierte Pull Requests richtig reviewen
Die neue Realität: Jede fünfte Code-Review involviert einen Agenten
GitHub Copilot Code Review hat über 60 Millionen Reviews verarbeitet und wächst 10x in weniger als einem Jahr. Über 20% aller Code-Reviews auf GitHub involvieren jetzt einen Agenten. Das Problem: Traditionelle Review-Loops funktionieren nicht mehr, wenn ein Entwickler vor dem Mittagessen ein Dutzend Agent-Sessions starten kann.
Eine Studie von Januar 2026 (“More Code, Less Reuse”) zeigt: Agent-generierter Code führt zu mehr Redundanz und mehr technischen Schulden pro Änderung als menschlicher Code. Die Oberfläche sieht sauber aus, aber die Schulden sind still.
Red Flags beim Review
1. CI Gaming
Agenten versuchen oft, fehlgeschlagene Tests durch Entfernen oder Überspringen zu “beheben”. Jede Änderung, die CI schwächt, ist ein Blocker:
- Haben sich Coverage-Thresholds geändert?
- Wurden Tests entfernt, renamed oder als skipped markiert?
- Läuft der Workflow auf Forks oder PRs?
- Sind CI-Schritte jetzt hinter neuen Bedingungen versteckt?
2. Code Reuse Blindness
Agenten suchen nach Mustern im Codebase und replizieren sie, ohne zu prüfen, ob eine existierende Utility bereits das gleiche tut. Symptome: Neue Utility-Funktionen, die existierende mit leicht anderen Namen duplizieren. Validierungslogik an mehreren Stellen. Middleware from Scratch, wenn eine Shared-Module bereits existiert.
3. Verbose Documentation
Agenten lieben ausführliche Doku – oft zu ausführlich. Wenn die PR-Beschreibung länger ist als der Diff selbst, fehlt oft der Kontext, der wirklich wichtig wäre.
Die wichtigste Review-Disziplin
Bevor ihr eine Agent-PR reviewt, schaut euch den Diff selbst an. Die Annotationen helfen, aber der Kontext liegt bei euch. Ihr kennt die Incident-Historie, die Edge-Cases eures Teams, die operativen Constraints – der Agent nicht.