CHAOSNODE

QIMMA: Qualitätsorientiertes Arabic LLM Leaderboard

Arabische NLP-Evaluation steht vor einem grundlegenden Problem: Die Anzahl der Benchmarks wächst rasant, aber werden wir wirklich das messen, was wir glauben? Das Technology …

Apr 26, 2026

News

Safetensors findet ein neues Zuhause bei der PyTorch Foundation

Ein Format wird erwachsen Safetensors hat sich vom Nischenprojekt zum De-facto-Standard für den Austausch von KI-Modellen entwickelt. Jetzt macht das Format den nächsten logischen …

Apr 26, 2026

Transformers zu MLX portieren mit KI-Agenten

Hugging Face hat einen Skill und einen Test-Harness veröffentlicht, um Sprachmodelle von Transformers zu MLX-LM zu portieren. Das Ziel: Modelle sollen (fast) augenblicklich …

Apr 26, 2026

VAKRA: Enterprise-Agent-Benchmark mit echten APIs

VAKRA von IBM Research ist ein tool-gegroundetes, ausführbares Benchmark, das misst, wie gut KI-Agenten in unternehmensähnlichen Umgebungen denken und handeln können. Im Gegensatz …

Apr 26, 2026

DeepSeek-V4: Millionen-Token-Kontext für Agenten

DeepSeek hat V4 veröffentlicht. Zwei MoE-Checkpoints sind verfügbar: DeepSeek-V4-Pro mit 1.6T Parametern und DeepSeek-V4-Flash mit 284B Parametern. Beide bieten ein …

Apr 25, 2026

Models

Gemini 3.1 Flash TTS: Expressive Sprachsynthese trifft Präzision

Sprachsynthese mit Regisseur-Stuhl Text-to-Speech war lange eine Black Box: Du gibst Text ein, bekommst Audio. Feinsteuerung? Fehlanzeige. Gemini 3.1 Flash TTS ändert das …

Apr 25, 2026

GitHub Copilot: Neue Limits und Preise für Pro-Pläne

GitHub hat signifikante Änderungen an den Copilot-Individualplänen angekündigt. Neuanmeldungen werden pausiert, Nutzungslimits verschärft und Opus-Modelle aus Pro entfernt. Die …

Apr 25, 2026

News

Google Flow Music: Das KI-Studio für Musikproduktion

Musik produzieren im Chat mit Producer Stell dir vor, du sitzt im Studio mit einem Produzenten, der jede musikalische Idee sofort umsetzt. Genau das ist Flow Music. Du chattest mit …

Apr 25, 2026

Googles Veo 3.1 Lite: Kostengünstige Video-Generierung für Entwickler

Google hat Veo 3.1 Lite veröffentlicht, das kostengünstigste Modell der Veo-3.1-Familie. Entwickler können nun hochvolumige Videoanwendungen zu weniger als 50% der Kosten von Veo …

Apr 25, 2026

Tutorials

Graph Neural Networks: Eine sanfte Einführung

Graphen sind überall Graphen sind das natürliche Format für vernetzte Daten: soziale Netzwerke, Moleküle, Empfehlungssysteme, Wissensgraphen. Aber wie bringt man neuronale Netze …

Apr 25, 2026

Tools

Hack den Agenten: GitHub Secure Code Game Season 4

Wenn dein persönlicher Assistent zum Angriffsziel wird OpenClaw nannten sie “ein Portal zu einer neuen Realität” – ein persönlicher KI-Assistent, der E-Mails abruft, …

Apr 25, 2026

LamBench: Lambda-Calculus-Benchmark für KI-Modelle

LamBench ist ein neuer Benchmark, der die Fähigkeiten von Sprachmodellen im Umgang mit dem Lambda-Kalkül testet. Der Fokus liegt auf logischem Denken und funktionaler …

Apr 25, 2026