Ai2 veroeffentlicht olmo-eval - Evaluierungs-Workbench fuer LLMs
Neues Tool Allen AI (Ai2) hat olmo-eval veroeffentlicht, eine Evaluierungs-Workbench fuer den LLM-Entwicklungszyklus. Das Tool baut auf OLMES auf, dem Open Language Model …
Anthropic entschuldigt sich für unsichtbare Claude Fable Guardrails
Anthropic hat sich für versteckte Guardrails in Claude Fable 5 entschuldigt, die Nutzer bei Distillations-Versuchen ohne Warnung drosselten. Das Unternehmen ändert nun seinen …
Claude Fable ist 'relentlessly proactive' – Simon Willison dokumentiert autonomes Verhalten
Simon Willison beschreibt in einem faszinierenden Blogpost sein zweiwöchiges Erlebnis mit Claude Fable 5. Sein Fazit: Das Modell ist “relentlessly proactive” – es setzt …
Claude-Gespräche massenhaft löschen - GitHub-Tool veröffentlicht
GitHub-Release Ein neues Open-Source-Tool auf GitHub ermöglicht das massenhafte Löschen aller Claude-Gespräche über die interne API. Entwickler Matteo Leonesi hat das …
Homebrew 6.0.0 mit Tap Trust, interner JSON API und Linux Sandbox
Homebrew 6.0.0 ist veröffentlicht. Die größte Version seit 5.0 bringt wichtige Sicherheitsverbesserungen und Performance-Optimierungen.
Tap Trust Security: Third-Party Taps können …
Klage gegen OpenAI - ChatGPT und Krisenhotlines
Gerichtsverfahren Eine neue Klage gegen OpenAI wirft ethische Fragen zum Umgang von ChatGPT mit suizidgefährdeten Nutzern auf. Die Familie einer 24-jährigen kanadischen Frau, Alice …
Qt-Stil reduziert AI-Slop in Frontend-Generierung
Beobachtung Ein Entwickler berichtet über einen interessanten Ansatz zur Verbesserung von KI-generierten Frontends: Das einfache Anweisen, eine Qt-ähnliche Oberfläche zu erstellen, …
Anthropic: 30-Tage Data-Retention für Mythos
Die neue Policy Ab dem 9. Juni 2026 verlangt Anthropic eine 30-Tage-Datenspeicherung für alle Mythos-Klasse-Modelle (Mythos 5, Fable 5 und zukünftige Modelle ähnlicher …
Anthropics Modell-Naming extrapoliert
Die literarische Evolution Mit der Veröffentlichung von Claude Fable ist klar: Anthropic entwickelt ein Portfolio, das die vollständige literarische Palette abdeckt. Von kurzen …
Claude Desktop startet 1.8 GB Hyper-V VM bei jedem Launch
Das Problem Claude Desktop für Windows startet bei jedem Launch eine vollständige Hyper-V Virtual Machine, die etwa 1.8 GB RAM verbraucht – selbst wenn Nutzer nur …
DiffusionGemma: 4x schnellere Text-Generierung
Ein Paradigmenwechsel in der Text-Generierung Google hat DiffusionGemma veröffentlicht – ein experimentelles Open-Source-Modell unter Apache 2.0 Lizenz, das die sequentielle …
Fable Guardrails: Security-Forscher unzufrieden
Die Enttäuschung Anthropic hat Claude Fable als öffentliche, limitierte Version des viel gehypten Mythos-Cybersecurity-Modells veröffentlicht. Aber Security-Forscher zeigen sich …