Article
Claude Fable 5: Anthropic veröffentlicht erstes Mythos-Modell mit eingebauten Safeguards
Anthropic hat mit Claude Fable 5 sein erstes „Mythos-Klasse"-Modell veröffentlicht, das nach eigenen Angaben die bisherigen Opus-Modelle in den Gesamtcapabilities übertrifft. Gleichzeitig positioniert das Unternehmen einen verschärften Sicherheitsansatz: Fable 5 lehnt gezielt Anfragen zu Cybersicherheit, Biologie und Chemie ab und leitet diese an das ältere Claude Opus 4.8 weiter.
Mythos 5 vs. Fable 5
Fable 5 basiert auf demselben zugrundeliegenden Modell wie Mythos 5, das nach monatelanger Preview-Phase heute für eine kleine Gruppe vertrauenswürdiger Cyber-Defender über Project Glasswing verfügbar wird. Der öffentliche Fable-5-Zugang hingegen ist mit strikten Klassifikatoren ausgestattet, die sensible Themen erkennen und blockieren:
- Cybersicherheit: Exploit-Entwicklung, Angriffsmethoden
- Biologie: Pathogen-spezifische Anfragen
- Chemie: Synthese gefährlicher Substanzen
Die Safeguards sind laut Anthropic „strenger als ideal" – in unter 5% der Sessions kann es zu False Positives kommen. In über 1.000 Stunden Red-Team-Testing fanden externe Teams keine universellen Jailbreaks.
Benchmark-Sprünge
Besonders bei Cybersicherheit zeigt Fable 5 deutliche Verbesserungen. Das UK AI Security Institute fand jedoch, dass Mythos Preview in Capture-the-Flag-Challenges ähnlich abschneidet wie OpenAI’s GPT-5.5 – was darauf hindeutet, dass die Leistung nicht modellspezifisch einzigartig ist.
Silent Sabotage-Kontroverse
Ein kritischer Punkt aus der Model Card hat Aufmerksamkeit erregt: Anders als bei anderen Safeguard-Kategorien (Cybersicherheit, Biologie) warnt Anthropic Nutzer nicht, wenn kompetitive AI-Entwicklungs-Queries eingeschränkt werden. Jonathon Ready analysierte dies als „Supply Chain Risk": Entwickler können nicht unterscheiden, ob Claude verwirrt ist oder ob eine unsichtbare Policy die Hilfe einschränkt.
Für Startups, die zunehmend eigene Embeddings, Reranker oder kleine LLMs trainieren, wird die Grenze zwischen „normaler Produktentwicklung" und „Frontier AI Development" zunehmend unscharf.
Verfügbarkeit
Fable 5 ist ab sofort öffentlich verfügbar. Mythos 5 bleibt auf Project Glasswing-Teilnehmer beschränkt.
Quelle: Anthropic News, Ars Technica, Jonathon Ready