Article

Wie Claude Agenten CUDA-Kernel programmieren beibringt

Claude CUDA Agent Skills LLM Open Source Tutorial

Agent Skills revolutionieren die Art und Weise, wie Coding-Agenten komplexe Aufgaben bewältigen. Das neue Tool upskill ermöglicht es, Fähigkeiten von leistungsstarken Modellen auf kleinere und günstigere Modelle zu übertragen – und die Performance dabei zu messen.

Das Konzept der Agent Skills

Agent Skills definieren Modell-Kontext als Dateien: Anweisungen als Markdown, Code als Skripte. Das Dateiformat macht sie einfach zu generieren, zu teilen und zu überprüfen. Besonders nützlich sind sie für spezifische Domänen oder schwierige Probleme – Aufgaben, die das Modell nicht ohnehin gut beherrscht.

Der Upskill-Workflow

Der Prozess funktioniert in drei Schritten:

  1. Teacher-Modell nutzen: Zuerst wird ein leistungsstarkes Modell wie Claude Opus 4.5 verwendet, um eine Aufgabe interaktiv zu lösen und die Spur zu exportieren.

  2. Skill generieren: Aus der Lösungsspur wird ein Skill erstellt, inklusive Testfällen zur Validierung.

  3. Auf kleinere Modelle übertragen: Der Skill wird auf kleinere oder günstigere Modelle angewendet und die Performance wird gemessen.

Praktisches Beispiel: CUDA-Kernel

Im Beispiel wird gezeigt, wie upskill einen Skill erstellt, der Claude alles über CUDA-Entwicklung beibringt: Welche GPU-Architektur, wie man ein Kernel-Builder-Projekt strukturiert, wann man Shared Memory versus Register verwendet, und wie man PyTorch-Bindings schreibt.

Domänenwissen, das Stunden der Dokumentationsrecherche erfordern würde, wird in etwa 500 Token verpackt, die bei Bedarf geladen werden. Dies demonstriert das Potenzial von Agent Skills: Expertise komprimieren und zwischen Modellen übertragbar machen.