Article
Wie Claude Agenten CUDA-Kernel programmieren beibringt
Agent Skills revolutionieren die Art und Weise, wie Coding-Agenten komplexe Aufgaben bewältigen. Das neue Tool upskill ermöglicht es, Fähigkeiten von leistungsstarken Modellen auf kleinere und günstigere Modelle zu übertragen – und die Performance dabei zu messen.
Das Konzept der Agent Skills
Agent Skills definieren Modell-Kontext als Dateien: Anweisungen als Markdown, Code als Skripte. Das Dateiformat macht sie einfach zu generieren, zu teilen und zu überprüfen. Besonders nützlich sind sie für spezifische Domänen oder schwierige Probleme – Aufgaben, die das Modell nicht ohnehin gut beherrscht.
Der Upskill-Workflow
Der Prozess funktioniert in drei Schritten:
Teacher-Modell nutzen: Zuerst wird ein leistungsstarkes Modell wie Claude Opus 4.5 verwendet, um eine Aufgabe interaktiv zu lösen und die Spur zu exportieren.
Skill generieren: Aus der Lösungsspur wird ein Skill erstellt, inklusive Testfällen zur Validierung.
Auf kleinere Modelle übertragen: Der Skill wird auf kleinere oder günstigere Modelle angewendet und die Performance wird gemessen.
Praktisches Beispiel: CUDA-Kernel
Im Beispiel wird gezeigt, wie upskill einen Skill erstellt, der Claude alles über CUDA-Entwicklung beibringt: Welche GPU-Architektur, wie man ein Kernel-Builder-Projekt strukturiert, wann man Shared Memory versus Register verwendet, und wie man PyTorch-Bindings schreibt.
Domänenwissen, das Stunden der Dokumentationsrecherche erfordern würde, wird in etwa 500 Token verpackt, die bei Bedarf geladen werden. Dies demonstriert das Potenzial von Agent Skills: Expertise komprimieren und zwischen Modellen übertragbar machen.