Article

Claude lehrt Open-Source-Modelle CUDA-Kernel zu schreiben

May 16, 2026

Ein neuer Ansatz von HuggingFace demonstriert das “Upskilling” von Coding Agents: Ein Skill, mit dem Claude Opus komplexe CUDA-Kernel entwickelt und diese Faehigkeit dann an kleinere Open-Source-Modelle weitergibt. Das Ergebnis: Modelle, die auf Laptops laufen, koennen optimierte GPU-Kernel fuer diffusers und transformers schreiben.

Das Problem

CUDA-Kernel zu schreiben ist schwierig. Die Integration mit transformers und diffusers erfordert architekturspezifische Speicherzugriffsmuster, Vektorisierungsstrategien, Warp-Shuffle-Reduktionen und Dutzende Integrationsfallen. Das Kernel Hub loeste die Distribution - mit get_kernel() koennen vorkompilierte Kernel geladen werden. Aber jemand muss sie schreiben.

Der Skill-Ansatz

Agent Skills definieren Modell-Kontext als Dateien: Instruktionen als Markdown, Code als Skripte. Das Dateiformat macht sie leicht generierbar, teilbar und ueberpruefbar. Fuer spezialisierte Doemaenen oder schwere Probleme - die Dinge, die das Modell nicht ohnehin gut kann - sind sie besonders wertvoll.

Der Prozess:

Claude Code baut interaktiv einen Kernel und exportiert den Trace
Der upskill-Befehl generiert und evaluiert Skills mit grossen Modellen
Kleinere Modelle nutzen den Skill fuer dieselbe Aufgabe

Konkrete Resultate

Die Teams zielten auf zwei echte Ziele: eine diffusers-Pipeline und ein transformers-Modell. Die Agents produzierten funktionierende Kernel mit korrekten PyTorch-Bindings und Benchmarks - End-to-End.

Interessant: Ein “naiver” Skill basierend auf Dokumentation verbesserte manche Modelle, verschlechterte aber andere oder erhoehte Token-Verbrauch. Iteratives Verbessern der Skills und Testen an kleineren Modellen war der Schluessel.

Warum das wichtig ist

Der Ansatz zeigt einen Weg, wie spezialisiertes Fachwissen - hier GPU-Optimierung - codifiziert und an kleinere Modelle weitergegeben werden kann. Statt jedes Mal ein SOTA-Modell zu fragen, kann das Wissen einmal aufbereitet und dann lokal genutzt werden.

Quelle: HuggingFace Blog