Tutorials

Anthropic Research: Global Workspace Theory in Language Models

Anthropic veröffentlicht eine neue interpretability-Studie zur Global Workspace Theory (GWT) in Language Models. Die Forschung untersucht, wie LLMs Informationen über verschiedene …

Jul 07, 2026

GLM 5.2: Der erste echte Open-Weights-Konkurrent für Claude Opus

Martin Alderson argumentiert, dass der “echte DeepSeek-Moment” jetzt kommt - mit GLM 5.2 von Z.ai. Das chinesische Modell erreicht erstmals das Niveau von Claude Opus …

Jul 07, 2026

Studie: Beeinflusst Code-Qualität die Performance von Coding Agents?

Ein neues arXiv-Paper (2605.20049) untersucht eine praktische Frage: Beeinflusst die Sauberkeit von Codebase die Performance von Coding Agents? Die Studie nutzt eine kontrollierte …

Jul 07, 2026

Claude Code zur Zweitmeinung bei MRT-Analyse genutzt

Ein Experiment am eigenen Körper Der Autor Antoine hatte seit einigen Wochen Schulterschmerzen und ließ ein MRT erstellen. Die Klinik diagnostizierte einen “Grad III …

Jun 29, 2026

MacBook vs. Dedicated GPU: Was läuft besser lokal?

Eine aktuelle Diskussion auf Hacker News beleuchtet die praktischen Unterschiede zwischen MacBooks mit Unified Memory und dedizierten GPUs beim lokalen Betrieb von LLMs. Die …

Jun 27, 2026

vLLM Server auf Hugging Face Jobs mit einem Befehl starten

Hugging Face hat eine elegante Lösung für LLM-Serving ohne Infrastruktur-Frickelei veröffentlicht: vLLM auf HF Jobs mit einem einzigen Befehl. Der Setup: huggingface-cli job create …

Jun 26, 2026

RubyLLM: Ein Ruby-Framework für alle großen AI-Provider

RubyLLM ist ein einheitliches Ruby-Framework, das eine konsistente API für alle großen AI-Provider bietet – von OpenAI über Anthropic bis zu lokalem Ollama. Statt sich durch …

Jun 25, 2026

GLM-5.2 auf lokaler Hardware mit Unsloth

GLM-5.2 ist Z.ai’s neuestes offenes Modell mit beeindruckenden Spezifikationen: 744 Milliarden Parameter, 40 Milliarden aktive Parameter und ein 1M Kontextfenster. Das Modell …

Jun 23, 2026

Codex Logging Bug: Bis zu 640 TB Schreibvolumen pro Jahr

Ein kritischer Bug in OpenAIs Codex CLI kann SSDs innerhalb eines Jahres zerstören. SQLite Feedback-Logs schreiben kontinuierlich massive Datenmengen. Der Nutzer @1996fanrui …

Jun 22, 2026

Firecracker VMs in EC2: Browser-Use baut Cloud-Browser für unter 1 Sekunde Startzeit

Browser-Sessions müssen drei Dinge gleichzeitig sein: schnell starten, isoliert bleiben, und billig sein. Browser-Use hat seine Cloud-Infrastruktur neu aufgebaut - mit …

Jun 18, 2026

Local Qwen ist kein schlechteres Opus - es ist ein anderes Werkzeug

“Local Qwen 27B ist fast auf Opus-Niveau” - diese Aussage taucht immer wieder auf Social Media auf. Alex Ellis, Gründer von OpenFaaS und Betreiber mehrerer …

Jun 18, 2026

Lokale LLMs sind jetzt gut – Ein Erfahrungsbericht

Lokale Modelle endlich produktiv nutzbar Vicki Boykis dokumentiert ihren Weg durch lokale LLMs seit deren Entstehen. Ihr Fazit nach Jahren des Experimentierens: Lokale Modelle sind …

Jun 16, 2026

GitHub Copilot CLI: Slash Commands für Anfänger erklärt

GitHub veröffentlicht einen Guide zu den wichtigsten Slash-Commands der Copilot CLI. Slash-Commands fungieren als Kontrolloberfläche für den Terminal-basierten AI-Agenten und …

Jun 16, 2026

Lokale LLMs als Claude/GPT-Ersatz für tägliches Coding?

Eine Hacker News-Diskussion mit 759 Upvotes und 363 Kommentaren fragt: Hat jemand Claude/GPT vollständig durch lokale Modelle ersetzt? Die Community teilt Erfahrungen mit Qwen, …

Jun 16, 2026

AI-Coding zu Hause ohne Bankrott: Drei Strategien

Die Kostenfalle AI-Coding zu Hause muss nicht teuer sein. Stephen Bochinski skizziert drei Wege – und welche sich für wen lohnt. Strategie 1: Self-Hosting Kaufen, nicht mieten. …

Jun 14, 2026

Dual-GPU Setup: RTX 5080 + RTX 3090 für 80+ Tok/s auf Qwen 3.6

Das Setup iMil zeigt, wie er eine RTX 5080 (16GB VRAM) mit einer refurbished RTX 3090 (24GB VRAM) kombiniert, um Qwen 3.6 27B Q8 mit über 80 Tok/s lokal laufen zu lassen. Hardware …

Jun 14, 2026

"Don't You Just Upload It to ChatGPT?" - Ein Übersetzer über KI-Realität

Juliette, eine professionelle Übersetzerin aus Ottawa, schildert einen Moment im Fitnessstudio, der die Kluft zwischen öffentlicher Wahrnehmung und professioneller Realität perfekt …

Jun 13, 2026

Anthropic entschuldigt sich für unsichtbare Claude Fable Guardrails

Anthropic hat sich für versteckte Guardrails in Claude Fable 5 entschuldigt, die Nutzer bei Distillations-Versuchen ohne Warnung drosselten. Das Unternehmen ändert nun seinen …

Jun 12, 2026

Anthropics Modell-Naming extrapoliert

Die literarische Evolution Mit der Veröffentlichung von Claude Fable ist klar: Anthropic entwickelt ein Portfolio, das die vollständige literarische Palette abdeckt. Von kurzen …

Jun 11, 2026

GPT-2: Too Dangerous To Release (2019)

Die Geburtsstunde der AI-Sicherheitsdebatte Im Februar 2019 traf OpenAI eine beispiellose Entscheidung: Das Unternehmen weigerte sich, das vollständige GPT-2 Modell zu …

Jun 11, 2026

Ich designe mittlerweile mehr mit Claude als mit Figma

Ein Designer bei Jane Street beschreibt, wie Claude seinen Workflow revolutionierte. Was mit Skepsis gegenüber LLMs begann, wurde zum unverzichtbaren Werkzeug – und verdrängt Figma …

Jun 08, 2026

Hat Claude Bugs in rsync verursacht? Eine Datenanalyse

Anfang Juni 2026 entzündete sich eine Kontroverse um rsync: Ein Mastodon-Post suggerierte einen Zusammenhang zwischen Claude-assistierten Commits und Regressionen. Die Empörung …

Jun 06, 2026

CS336: Sprachmodellierung von Grund auf

Stanford bietet mit CS336 einen Kurs an, der Studierende durch den gesamten Prozess der Entwicklung eines eigenen Sprachmodells führt. Inspiriert von Betriebssystemkursen, die ein …

Jun 02, 2026

Florida verklagt OpenAI und Sam Altman wegen KI-Risiken

Florida hat eine Klage gegen OpenAI und CEO Sam Altman eingereicht und wirft dem Unternehmen vor, die Risiken künstlicher Intelligenz zu verschleiern. Die Klage richtet sich gegen …

Jun 02, 2025