Article

Transformers zu MLX portieren mit KI-Agenten

April 26, 2026 mlx transformers apple silicon porting agents

Hugging Face hat einen Skill und einen Test-Harness veröffentlicht, um Sprachmodelle von Transformers zu MLX-LM zu portieren. Das Ziel: Modelle sollen (fast) augenblicklich verfügbar sein, sobald sie zu Transformers hinzugefügt werden. Der Skill ist als Unterstützung für Contributor und Reviewer konzipiert, nicht als Automatisierung.

Das Problem mit KI-generierten PRs

Im Jahr 2026 funktionieren Code-Agenten tatsächlich. Was früher Autovervollständigung am Rand des Editors war, wurde zu einem System, das aus kurzen Spezifikationen funktionierende Lösungen zaubert. Der generierte Code funktioniert meist, deckt ab, was man gefragt hat, und trifft vernünftige Annahmen über nicht spezifizierte Details.

Das zwingt zu einer Neugedanken über Open Source:

Transformers hat hunderte Contributor, wird in tausenden Projekten genutzt, wurde über eine Milliarde Mal heruntergeladen. Plötzlich kann jeder mit einem Agenten anweisen, ein offenes Issue zu finden, es zu beheben, und einen PR einzureichen. Das passiert genau jetzt. Aber meist realisieren diese Contributor nicht, dass sie keinen Mehrwert liefern.

Warum Codebases wie Transformers dem Code wichtig sind

Codebases wie Transformers sind in erster Linie als Mensch-zu-Mensch-Kommunikationsmethode durch Code gedacht. Modelldateien lesen sich von oben nach unten, weil wir möchten, dass Praktiker sie ohne komplexe Abstraktionen verstehen. Das durchdringt die gesamte Library-Design und ist der Grund für flache Hierarchien.

Agenten haben diesen Kontext nicht. Sie sind Wortreich, generalisieren zu früh, bemerken nicht, wenn eine Änderung andere Bereiche betrifft, führen subtile Bugs ein, und brechen die Performance. Sie sind auch sykophantisch und akzeptieren jede Idee als gut, einschließlich derer, die ein Maintainer früh mit einem knappen Kommentar zurückgewiesen hätte.

Die Lösung: Skill + Test-Harness

Der Skill unterstützt Contributor bei hochwertigen Model-Ports und hilft Reviewer bei ihrer Arbeit. Nicht nur produzieren wir PRs, die von einem sorgfältigen Menschen hätten kommen können, sondern wir stellen auch zusätzliche Artefakte bereit: Generierungsbeispiele, numerische Vergleiche und einen separaten nicht-agentischen Test-Harness für Reproduzierbarkeit.

Da Transformers auf Klarheit und Lesbarkeit fokussiert ist, ist es zur Wahrheitsquelle für Modelldefinitionen geworden. Downstream-Contributor warten darauf, dass Transformers-Implementierungen fertig sind, bevor sie zu anderen Frameworks portieren. Das begrenzt den Scope für den Agenten natürlich: Statt eine Implementierung von Grund auf zu erstellen, verlässt sich der Agent auf Transformers-Code als Wahrheitsquelle.

GitHub Repository