Models

Nunchaku Lite: 4-Bit Diffusion-Inferenz direkt in Diffusers

Was ist neu Hugging Face hat Nunchaku Lite in Diffusers integriert. Das bedeutet: 4-bit Diffusion-Inferenz direkt über from_pretrained(), ohne separate Inference-Engine, ohne …

Jul 23, 2026

Google Android Bench Update: Claude Fable 5 führt, Gemini hinkt hinterher

Google hat seinen Android Bench Benchmark aktualisiert und acht neue LLMs hinzugefügt. Die Ergebnisse zeigen eine deutliche Verschiebung in der Leaderboard-Hierarchie – mit Claude …

Jul 09, 2026

NVIDIA: Warum Agents Open Data brauchen

NVIDIA betont in einem neuen Blogpost: Für echte AI-Agents reichen Model-Weights nicht aus. Open Data ist der Schlüssel zu reproduzierbarem, inspizierbarem Agentenverhalten – und …

Jul 09, 2026

Mistral Robostral Navigate: Single-Camera Robot Navigation

Mistral AI hat mit Robostral Navigate sein erstes Modell für embodied Navigation vorgestellt. Der 8-Milliarden-Parameter-Vision-Language-Model ermöglicht Robotern, komplexe …

Jul 08, 2026

vLLM Transformers Backend erreicht Native-Speed

HuggingFace hat einen wichtigen Meilenstein erreicht: Der Transformers-Modeling-Backend für vLLM ist nun so schnell (oder schneller) als handgeschriebene native …

Jul 08, 2026

PRX Part 4: Datenstrategie für Large-Scale Pre-Training

Photoroom veröffentlicht Teil 4 der PRX-Serie: Eine detaillierte Analyse ihrer Data Pipeline für das Training eines 7B Vision-Language Models. Von Re-Captioning mit VLMs bis zu …

Jul 07, 2026

LeRobot v0.6.0: Robotik-Policies die die Zukunft "vorstellen"

LeRobot v0.6.0 schließt den Robotik-Lern-Loop: World Models, die die Zukunft vorhersagen, Reward-Models für Erfolgserkennung, und ein Deployment-CLI, das Fehler in Trainingsdaten …

Jul 07, 2026

Hugging Face Modelle auf Microsoft Foundry Managed Compute

Microsoft Build 2026 brachte eine bedeutende Ankündigung für Enterprise-KI: Foundry Managed Compute mit kuratiertem Katalog von Hugging Face Modellen. Ein-Klick-Deployment auf …

Jul 07, 2026

🤗 Kernels: HuggingFace überholt Kernel-System mit Security-Features und neuem Repository-Typ

HuggingFace führt einen komplett überarbeiteten Kernels-Standard ein: Neuer Repository-Typ, Trusted Publishers, Code-Signing und erweiterte Framework-Unterstützung machen Custom …

Jul 06, 2026

Leanstral 1.5: Mistral's neues Open-Source-Modell für formale Beweise

Mistral veröffentlicht Leanstral 1.5 – ein Apache-2.0 lizenziertes Modell mit 119B total und nur 6B aktiven Parametern, spezialisiert auf formale Verifikation in Lean 4. Die …

Jul 04, 2026

Twilight of the Gods: Fable und 10 LLMs im Refactoring-Vergleich

Korridzy vergleicht Fable-5 mit GPT-5.4, GPT-5.5, DeepSeek-4-pro, Gemini-3.1-pro, GLM-5.1, Kimi-2.6, MiMo-2.5-pro, Opus-4.7, Qwen-3.6-plus und Qwen-3.7-max bei einer echten …

Jul 02, 2026

Google Nano Banana 2 Lite: Schnellstes und günstigstes Bildmodell

Google DeepMind hat mit Nano Banana 2 Lite ein neues Bildmodell vorgestellt, das sich durch extreme Geschwindigkeit und niedrige Kosten auszeichnet. Das Modell, offiziell Gemini …

Jul 01, 2026

ScarfBench: Benchmark für AI-Agenten bei Java-Framework-Migration

IBM Research hat ScarfBench vorgestellt, einen Benchmark, der speziell darauf ausgelegt ist, die Fähigkeiten von AI-Agenten bei der Migration von Enterprise-Java-Anwendungen zu …

Jul 01, 2026

Every Eval Ever: Standardisierte KI-Evaluationen auf HuggingFace

HuggingFace und die EvalEval Coalition haben ihre Evaluations-Systeme interoperabel gemacht. Every Eval Ever (EEE) und Community Evals können nun Ergebnisse austauschen, …

Jun 30, 2026

Warum KI-Spezialisierung unvermeidlich ist

Die konventionelle Erwartung ist naheliegend: Je leistungsfähiger KI-Systeme werden, desto allgemeiner sollten sie sein. Mehr Fähigkeiten, breitere Anwendbarkeit – das scheint wie …

Jun 30, 2026

Zluda 6: CUDA auf nicht-Nvidia GPUs mit PhysX-Support

Zluda, das Projekt zur Ausführung unmodifizierter CUDA-Anwendungen auf nicht-Nvidia GPUs, veröffentlicht Version 6 mit bahnbrechenden Neuerungen: PhysX-Support, verbesserte …

Jun 30, 2026

Krea 2: Open-Weights Bildmodell mit 12B Parametern für kreative Exploration

Krea hat Krea 2 veröffentlicht – eine Serie von Foundation-Modellen für Bildgenerierung mit Fokus auf kreative Exploration und breite ästhetische Vielfalt. Die Modellgewichte …

Jun 25, 2026

Cross-Origin Storage API in Transformers.js: Model-Sharing im Browser

Thomas Steiner vom Chrome-Team bei Google veröffentlicht einen Deep-Dive zur experimentellen Cross-Origin Storage API in Transformers.js. Das Problem ist bekannt: Jede Web-App, die …

Jun 24, 2026

Claude Code Extended Thinking: Der Output ist nicht authentisch

Patrick McCanna hat eine kritische Analyse von Claude Codes “Extended Thinking” veröffentlicht, die wichtige Erkenntnisse für AI-Entwickler und Audit-Anwendungen …

Jun 24, 2026

DiffusionBench: Holistische Evaluation von Generativen Diffusion Transformers

DiffusionBench ist ein neuer Benchmark für die ganzheitliche Evaluation generativer Diffusion Transformers. Das Open-Source-Projekt zielt darauf ab, die Qualität von …

Jun 24, 2026

Mistral OCR 4: SOTA OCR für Document Intelligence

Mistral AI veröffentlicht OCR 4, das neueste Optical Character Recognition Modell mit State-of-the-Art-Leistung für Document Intelligence. Die Version bringt Bounding Boxes, …

Jun 24, 2026

Qwen-AgentWorld: Language World Models for General Agents

Ein Weltmodell sagt Umgebungsdynamiken basierend auf aktuellen Beobachtungen und Aktionen voraus und dient als zentraler kognitiver Mechanismus für Reasoning und Planung. Das …

Jun 24, 2026

Lokale Modelle für GitHub Issue Triage – Kostenlos

Warum lokale Modelle? Juni 2026 wird als der Moment in Erinnerung bleiben, als Menschen realisierten, dass geschlossene Modelle jederzeit weggenommen werden können. Mit der …

Jun 23, 2026

Hugging Face: Wöchentliche Releases mit AI und Human-in-the-Loop

Das Problem: Releases alle 4-6 Wochen huggingface_hub ist der Python-Client an der Basis des Hugging Face Ökosystems. transformers, datasets, diffusers, sentence-transformers und …

Jun 23, 2026

CUGA: IBM's Open-Source Agent Harness für Enterprise AI

Das Problem: Wochenlange Plumbing vor dem eigentlichen Agent Die meisten Agenten-Apps starten mit einer Woche Plumbing, bevor der Agent etwas Nützliches tut. Man wählt ein …

Jun 23, 2026

Moebius: 0.2B Image Inpainting mit 10B-Level Performance

Chinesische Forscher stellen Moebius vor: Ein Bild-Inpainting-Modell mit nur 226M Parametern, das mit 10B-Modellen wie FLUX.1-Fill-Dev konkurriert. Das Team von HUSTVL (Huazhong …

Jun 22, 2026

PP-OCRv6: 50-Sprachen OCR von 1.5M bis 34.5M Parametern

PaddlePaddle veröffentlicht PP-OCRv6, die neueste Generation ihrer universellen OCR-Modellfamilie mit Unterstützung für 50 Sprachen. PP-OCRv6 skaliert von 1.5M bis 34.5M Parameter …

Jun 22, 2026

Apertus: Volloffenes Foundation Model für Sovereign AI

Die Swiss AI Initiative – eine Zusammenarbeit von EPFL, ETH Zürich und CSCS – stellt Apertus vor: ein Foundation Model, das den Prinzipien der offenen Wissenschaft folgt. Was …

Jun 22, 2026

Is it agentic enough? Open Source Modelle auf eigener Tooling-Benchmark testen

Coding Agents arbeiten zunehmend mit unserer Software statt dass wir sie schreiben. Du beschreibst einen Task, und der Agent wählt die Library, schreibt die Aufrufe, führt sie aus …

Jun 18, 2026

Beyond LoRA: Kann die beliebteste Fine-Tuning-Technik geschlagen werden?

Parameter-Efficient Fine-Tuning (PEFT) ist aus dem modernen Machine Learning nicht mehr wegzudenken. Wenn du ein Open-Source-Modell auf deinen eigenen Daten fine-tunen möchtest, …

Jun 18, 2026

GLM-5.2 dominiert Artificial Analysis Intelligence Index als führendes Open-Weights-Modell

Der Benchmark Artificial Analysis hat GLM-5.2 auf dem Intelligence Index v4.1 getestet. Das Ergebnis: Modell Intelligence Index GLM-5.2 51 MiniMax-M3 44 DeepSeek V4 Pro (max) 44 …

Jun 17, 2026

MolmoMotion: Allen AI veröffentlicht Sprach-geführtes 3D-Bewegungsprognose-Modell

Vorhersage statt Beobachtung Allen AI hat MolmoMotion veröffentlicht – ein Modell, das nicht Bewegungen beobachtet, sondern sie vorhersagt. Während aktuelle Computer-Vision-Systeme …

Jun 17, 2026

Strands Agents + LeRobot: Von Hugging Face Hub direkt zur Roboter-Hardware

Das Problem Du hast einen Roboter, Demo-Daten auf dem Hugging Face Hub und eine neue Aufgabe, die er lernen soll. Heute brauchst du dafür fünf separate Tools: Aufnahme neuer Demos …

Jun 17, 2026

SubQ 1.1 Small: 12M Token Context mit O(n) Attention

Subquadratic Sparse Attention: Langzeitkontext ohne quadratischen Aufwand Subquadratic veröffentlicht den Model Card für SubQ 1.1 Small – die zweite Iteration ihres SSA-Modells …

Jun 16, 2026

GLM 5.2: Zhipu veröffentlicht frontier-fähiges Open-Source-Modell

Radikale Offenheit als Antwort Zhipu AI, Chinas führendes AI-Unternehmen, hat GLM 5.2 veröffentlicht – sein leistungsfähigstes Open-Source-Modell bis dato. Die Ankellung von Jie …

Jun 14, 2026

Claude Fable 5: Mythos-Hype mit durchschnittlichen Benchmark-Ergebnissen

Endor Labs hat Anthropics neues Mythos-Modell Claude Fable 5 mit Claude Code auf 200 realen Sicherheitsaufgaben getestet. Das Ergebnis: durchschnittliche Leistung mit …

Jun 13, 2026

Kimi K2.7-Code: Open-Source Coding Model mit verbesserter Token-Effizienz

Moonshot AI hat Kimi K2.7-Code veröffentlicht, ein Open-Source-Coding-Modell mit verbesserter Token-Effizienz. Das Modell ist auf Hugging Face verfügbar und unterstützt sowohl …

Jun 13, 2026

DiffusionGemma: 4x schnellere Text-Generierung

Ein Paradigmenwechsel in der Text-Generierung Google hat DiffusionGemma veröffentlicht – ein experimentelles Open-Source-Modell unter Apache 2.0 Lizenz, das die sequentielle …

Jun 11, 2026

MiMo-V2.5-Pro-UltraSpeed: 1T-Modell bricht 1000 TPS-Barriere

Xiaomi bricht erstmals die 1000 Tokens/Sekunde-Barriere mit einem 1-Billionen-Parameter-Modell. MiMo-V2.5-Pro-UltraSpeed, entwickelt in Zusammenarbeit mit TileRT, erreicht …

Jun 08, 2026

The crash that vanished: Kontrolle und Emergenz in einer Fünf-Modell-Ökonomie

Wenn ein Bank Run-Szenario plötzlich verschwindet, weil verschiedene LLMs anders reagieren. Lester Leong vom Build Small Hackathon dokumentiert ein faszinierendes Experiment zur …

Jun 08, 2026

OpenAI Codex Track beim Build Small Hackathon

HuggingFaces Build Small Hackathon bietet einen speziellen OpenAI Codex Track mit einer interessanten Wendung: Codex selbst bewertet die Einreichungen. Der Preis: $10.000 Cash plus …

Jun 07, 2026

Five Labs, Five Minds: Multi-Model Finance Drama

Ein faszinierendes Experiment von HuggingFace zeigt, was passiert, wenn fünf verschiedene KI-Modelle von unterschiedlichen Laboren in einer simulierten Wirtschaft interagieren. …

Jun 07, 2026

Tokenomics: Wo Tokens in Agentic Software Engineering konsumiert werden

Ein neues Forschungspaper von arXiv quantifiziert erstmals systematisch, wo genau Tokens in Multi-Agent-Software-Entwicklungssystemen verbraucht werden. Die Studie analysiert 30 …

Jun 07, 2026

KVarN: Native vLLM KV-Cache Quantisierung mit 3-5x mehr Kontext

Huawei veröffentlicht KVarN, einen nativen KV-Cache-Quantisierungs-Backend für vLLM, der 3-5x mehr KV-Cache-Kapazität bietet – bei FP16-Genauigkeit und sogar höherem Durchsatz als …

Jun 04, 2026

DPO Beyond Chatbots: Wenn Modelle aus Fehlern lernen

Direct Preference Optimization (DPO) wird meistens für Chat-Alignment eingesetzt – aber DharmaAI zeigt mit DharmaOCR, dass DPO auch für strukturierte OCR-Tasks funktioniert. Der …

Jun 03, 2026

MCP Tools für Reachy Mini: Robot-Fähigkeiten via Hugging Face Spaces

Der Reachy Mini Roboter kann jetzt Tools nutzen, die in öffentlichen Hugging Face Spaces gehostet werden – aufgerufen via MCP (Model Context Protocol). Statt Code lokal zu …

Jun 03, 2026

MAI-Code-1-Flash: Microsofts neues Coding-Modell

Microsoft führt MAI-Code-1-Flash ein – ein effizientes Coding-Modell, das speziell für GitHub Copilot optimiert ist. Das Besondere: Es wurde direkt mit den Copilot-Harnesses aus …

Jun 03, 2026

Holo3.1: Schnelle lokale Computer-Use-Agenten

H Company hat Holo3.1 veröffentlicht, eine Familie von Computer-Use-Modellen, die sich durch verbesserte Robustheit über verschiedene Umgebungen hinweg auszeichnet. Neu sind …

Jun 02, 2026

PyTorch Profiling Teil 3: Attention ist alles was du profilierst

Die Profiling-in-PyTorch-Serie Hugging Face setzt seine Profiling-Serie fort mit Attention-Mechanismen – dem Herzstück moderner Transformer-Architekturen. Nach den Grundlagen in …

Jul 10, 2025