Tutorials
C++: The Documentary - 40 Jahre Erfolgsstory
Herb Sutter kündigt die Veröffentlichung von “C++: The Documentary” an - ein 70-minütiger Rückblick auf 40 Jahre C++-Entwicklung mit Bjarne Stroustrup und zahlreichen …
Ladybird ändert die Entwicklungsrichtung
Das Ladybird-Projekt, ein unabhängiger Open-Source-Webbrowser, hat Änderungen an seinem Entwicklungsmodell bekanntgegeben. Die Initiative, die aus SerenityOS hervorging, verfolgt …
Uruky: EU-basierte Kagi-Alternative mit Bildersuche
Uruky positioniert sich als europäische Alternative zu Kagi - eine Privatsphäre-fokussierte Suchmaschine ohne Werbung und Tracking. Neu: Bildersuche und URL-Rewrite-Features. …
Weltraumgestützte GNSS-Interferenz: Russische Molniya-Satelliten identifiziert
Ein Forschungsteam der University of Texas hat die Quelle persistenter GNSS-Interferenzen über Europa, Grönland und Kanada identifiziert: Eine Konstellation russischer …
CS336: Sprachmodellierung von Grund auf
Stanford bietet mit CS336 einen Kurs an, der Studierende durch den gesamten Prozess der Entwicklung eines eigenen Sprachmodells führt. Inspiriert von Betriebssystemkursen, die ein …
PyTorch Profiler Tutorial: Performance-Engpässe systematisch finden
Wer mehr Tokens pro Sekunde aus einem LLM herausholen oder Millisekunden bei der Inference sparen will, kommt am Profiling nicht vorbei. Kurzbeschreibung HuggingFace startet eine …
Stanford CS336: Sprachmodelle von Grund auf lernen
Stanford CS336 ist ein fortschrittlicher Kurs, der Studierende durch den kompletten Prozess der Entwicklung eines eigenen Sprachmodells fuehrt – angelehnt an das bewaehrte Konzept …
Guenstige VRAM-Upgrades fuer lokale LLM-Entwicklung
Kurzfassung Wie man mit 200 GBP und einem SXM2-Adapter 32GB VRAM erreicht. Ein Praxis-Tutorial fuer Entwickler, die lokal mit groesseren Modellen experimentieren wollen. Abstract …
Refactoring ohne RisikoVier Teams zeigen wie es geht
Die Refactoring-Falle Jeder kennt das Problem: Die Codebasis braucht Aufmerksamkeit, aber das Refactoring wird aufgeschoben. Laut einer Microsoft-Studie von 2014 halten 76% der …
Agenten-Harness Scaffold und KI-Agent-Begriffe
Die Welt der KI-Agenten entwickelt sich rasant, und mit ihr eine verwirrende Terminologie. Ein Agent-Harness ist das Framework, das einen KI-Agenten mit den notwendigen Werkzeugen …
ITBench-AA - Erster Agenten-Benchmark fuer Enterprise-IT
IBM und Artificial Analysis haben ITBench-AA veroeffentlicht. Der erste Benchmark speziell fuer agentische IT-Tasks. Was ist ITBench-AA ITBench-AA testet Infrastructure Management, …
PyTorch Profiler: Einsteiger-Guide für torch.profiler
Was du nicht profilieren kannst, kannst du nicht optimieren Profiling ist der Schlüssel zur Performance-Optimierung – egal ob du mehr Tokens pro Sekunde aus einem LLM pressen …
Anthropic sammelt 65 Milliarden Dollar ein
Anthropic hat eine der größten Finanzierungsrunden in der Geschichte der KI-Industrie abgeschlossen: 65 Milliarden Dollar in der Series H, was das Unternehmen mit 965 Milliarden …
Reachy Mini lokal betreiben: Sprachsteuerung ohne Cloud
Kurzbeschreibung Hugging Face zeigt, wie Sie Reachy Mini mit vollständig lokaler Sprachpipeline betreiben. Keine Cloud, keine API-Keys, keine Daten verlassen Ihr Netzwerk – alles …
Was Benchmarks uns wirklich sagen
Die Lenz Research Studie über LLM-Disagreement bei Faktenchecks hat fundamentale Implikationen für alle, die KI-Modelle in Produktion einsetzen. Wenn selbst die …
KI-Kennzeichnung auf YouTube: Ein Praxisleitfaden
YouTube hat im Mai 2026 ein verbessertes System für KI-Kennzeichnungen eingeführt. Für Creator stellt sich die Frage: Wie nutze ich das richtig? Dieser Guide erklärt die Praxis. …
KI-Agenten in der Praxis: ITBench-AA Benchmark zeigt Grenzen auf
Artificial Analysis und IBM haben mit ITBench-AA einen neuen Benchmark veröffentlicht, der KI-Agenten auf realen Enterprise-IT-Aufgaben testet. Der Fokus liegt auf Site Reliability …
Agent Harness Engineering: Wie man AI-Agenten wirklich baut
Agent-Glossare sind gut. Aber wie baut man einen Agenten tatsächlich? Das Hugging Face Glossar liefert die Konzepte – hier ist der Engineering-Teil. Die Architektur verstehen Ein …
JetBrains finding-tests Skill: Halbierte Token-Kosten für AI-Agenten
Wenn ein AI-Agent einen Test schreiben soll, beginnt meist das gleiche Problem: Wo gehört dieser Test hin? Der Agent scannt Ordnernamen, grept nach Methoden, liest Datei nach …
Ollama für lokale KI-Modelle als Schnellstart-Guide
Ollama hat sich als Standard-Tool für den Betrieb von Large Language Models auf lokaler Hardware etabliert. Dieser Guide zeigt den schnellsten Weg zu einem funktionierenden Setup …
VS Code für Git und GitHub - Ein praktischer Einstieg
Visual Studio Code hat sich als einer der beliebtesten Code-Editoren etabliert. Die eingebaute Git-Integration ermöglicht Repository-Verwaltung ohne Terminal - ein Feature, das …
Von Go zu Rust: Ein praktischer Migrationsleitfaden für Backend-Entwickler
Warum dieser Vergleich relevant ist Go zu Rust ist unter Migrationen ein Sonderfall. Es geht nicht um Performance oder Typsicherheit – Go liefert beides bereits. Die Diskussion …
Claude ist nicht dein Architekt: Warum KI-Agenten Design-Entscheidungen nicht übernehmen sollten
Eine kritische Betrachtung der aktuellen Praxis, KI-Agenten Architekturentscheidungen treffen zu lassen – und warum das gefährlich ist. Drei Organisationen in einem Monat, drei …
Writerdeck einrichten: Ein Linux-TTY für fokussiertes Schreiben
Writerdecks sind spezialisierte Geräte für fokussiertes Schreiben - ohne Benachrichtigungen, ohne Ablenkungen, ohne das ständige Grasern im Internet. Veronica Explains zeigt, wie …
Deep Learning Performance - Warum GPUs brrrr machen
Deep Learning Performance: Warum GPUs brrrr statt brumm machen Viele Entwickler greifen bei Performanceproblemen zu einer Sammlung von Tricks aus Twitter-Threads. “Nutze …
Lokale Video-Indexierung: Ein Jahr Footage mit Gemma 4 auf 5 Jahre altem MacBook
Das Problem: Ein Archiv, das schneller wächst als man es bearbeiten kann Ein Fotograf oder Videograf sitzt oft auf demselben Problem: ein Archiv, das schneller wächst als man es …
vLLM V0 zu V1 Migration: Korrektheit vor Optimierung im RL-Training
Wer vLLM für Reinforcement Learning mit Sprachmodellen einsetzt, kennt das Problem: Die Migration von V0 auf V1 kann die Trainingsdynamik drastisch verändern. Ein detaillierter …
Ettin Reranker: Neue SOTA-Modelle für Semantic Search
Kurzbeschreibung Tom Aarsen veröffentlicht sechs neue CrossEncoder-Reranker basierend auf Ettin ModernBERT-Encodern. Die Modelle erreichen State-of-the-Art-Performance auf MTEB bei …
Cosmos Predict 2.5 Fine-Tuning für Roboter-Videos
Motivation NVIDIA Cosmos Predict 2.5 ist ein großes Weltmodell, das physikalisch plausible Videos aus Text, Bildern oder Videoclips generieren kann. Für spezifische …
Benchmark für Agenten: Open Agent Leaderboard gestartet
Wie gut funktionieren allgemeine AI-Agenten wirklich? IBM Research und Hugging Face beantworten diese Frage mit dem neuen Open Agent Leaderboard – einem offenen …
Kostenlos lernen: Googles AI-Agents-Intensivkurs kehrt zurück
Nach dem Erfolg des ersten Durchlaufs mit über 1.5 Millionen Lernenden bringt Google den 5-Tages-AI-Agents-Intensivkurs mit Kaggle zurück. Vom 15.-19. Juni 2026 können Teilnehmer …
GitHub Accessibility Agent: 68% Auflösungsrate bei 3.535 PRs
GitHub pilotiert einen experimentellen Accessibility-Agent, der Pull Requests auf Barrierefreiheitsprobleme prüft und automatisch behebt. Lektionen aus der Praxis. Zwei Hauptziele …
Accessibilility Agent bei GitHub: 68% Lösungsrate nach 3535 PRs
Was GitHub aus dem Pilotprojekt gelernt hat GitHub berichtet über den Einsatz eines KI-Agenten zur automatischen Barrierefreiheitsprüfung. Nach 3.535 überprüften Pull Requests und …
AI-Slop bekämpfen - Git Author Flag gegen Bot-Spam
Archestra zeigt, wie man sein GitHub-Repository mit einem cleveren Git-Trick vor AI-Bot-Spam schützt. Kurzbeschreibung Mit dem –author Flag und einem …
NVIDIA Cosmos Fine-Tuning: Weltmodelle für Roboter
Parameter-effizientes Training für synthetische Roboter-Demos NVIDIAs Cosmos Predict 2.5 ist ein großes Weltmodell, das physikalisch plausible Videos aus Text, Bildern oder …
NVIDIA Cosmos mit LoRA/DoRA für Robotik-Videos fine-tunen
NVIDIA zeigt in einem detaillierten Guide, wie man Cosmos Predict 2.5 für robotische Anwendungsfälle anpasst. Kurzbeschreibung Parameter-effizientes Fine-Tuning von NVIDIA Cosmos …
NVIDIA Cosmos: Fine-Tuning für Roboter-Videogenerierung
Parameter-effizientes Training für World Models NVIDIA Cosmos Predict 2.5 ist ein großes World Model für physikalisch plausible Videos. Um es für spezifische Domänen wie …
Warum KI Ihre Prozesse nicht beschleunigen wird
Die Illusion der Geschwindigkeit durch Automatisierung Frederick van Brabant analysiert in einem lesenswerten Beitrag ein verbreitetes Missverständnis: Viele Organisationen …
Warum KI Ihre Prozesse nicht beschleunigen wird
Die Illusion der Geschwindigkeit durch Automatisierung Frederick van Brabant analysiert in einem lesenswerten Beitrag ein verbreitetes Missverständnis: Viele Organisationen …
Asynchrones Continuous Batching für maximale GPU-Auslastung
Continuous Batching revolutioniert die LLM-Inference, aber ein oft übersehener Flaschenhals verschwendet dennoch bis zu einem Viertel der Runtime: synchrone CPU-GPU-Koordination. …
Lokale LLMs: Apple Silicon kostet mehr als OpenRouter
William Angel hat eine faszinierende Kostenrechnung angestellt: Was kostet es wirklich, LLMs lokal auf Apple Silicon zu betreiben? Die Ergebnisse überraschen. Die Stromkosten Ein …
Claude fuer KMUs: Workflows und Connectors fuer kleine Unternehmen
Anthropic hat Claude for Small Business angekuendigt: Ein Paket aus Connectors und Ready-to-Run Workflows, die Claude direkt in die Produkte integriert, die KMUs bereits nutzen. …
SQL-Patterns für Betrugserkennung in Transaktionen
Betrugserkennung braucht keine Machine Learning. Sie braucht SQL - die richtigen Joins, die richtigen Shapes, die richtigen Zeitfenster. Sechs Patterns für jede …
JetBrains Skill Manager: Einmal installieren, projektübergreifend nutzen
JetBrains führte den Skill Manager und Skill Repository ein – ein System, um verifizierte Agenten-Skills einmal zu installieren und projektübergreifend zu nutzen. Was sind Skills? …
WhichLLM: Das richtige lokale Modell für deine Hardware finden
Ein neues Open-Source-Tool namens WhichLLM hilft Entwicklern, das optimale lokale LLM für ihre spezifische Hardware-Konfiguration zu finden. Anstatt stundenlang Benchmarks zu …
Obsidian Plugins: Automatische Reviews und neue Community-Plattform
Obsidian hat eine neue Community-Plattform und ein automatisiertes Review-System für Plugins gestartet. Mit über 4.000 Plugins und Themes, die zusammen 120 Millionen Downloads …
Claude für kleine Unternehmen: Praktischer Einstieg
Anthropic hat mit Claude for Small Business ein dediziertes Paket für kleine und mittlere Unternehmen veröffentlicht. Es integriert Claude direkt in die Werkzeuge, die KMU täglich …
GitHub Dungeons: Dein Code wird zum Roguelike
Was passiert, wenn man GitHub Copilot CLI bittet, ein Repository in ein spielbares Roguelike-Dungeon zu verwandeln? Lee Reilly hat es ausprobiert und “GitHub Dungeons” …
Wie Claude Agenten CUDA-Kernel programmieren beibringt
Agent Skills revolutionieren die Art und Weise, wie Coding-Agenten komplexe Aufgaben bewältigen. Das neue Tool upskill ermöglicht es, Fähigkeiten von leistungsstarken Modellen auf …
Foundation Models auf AWS: Infrastructure für Pre-Training, Post-Training und Inference
NVIDIAs Drei-Skalierungsgesetze zeigen: Scaling ist nicht mehr eine einzelne Kurve. Pre-Training skaliert mit Modellparametern und Dataset-Größe. Post-Training optimiert …
Lerne Softwarearchitektur: Fundamentale Konzepte
Matklad, bekannt für tiefe technische Analysen, veröffentlicht einen neuen Artikel über Softwarearchitektur. Der Beitrag nähert sich dem Thema von ersten Prinzipien und erklärt, …
Stoppe AI-Code-Fehler vor dem Review
Ein kritischer Blog-Post von JetBrains adressiert ein wachsendes Problem: AI-generierter Code landet oft fehlerhaft im Code-Review, obwohl die IDE diese Probleme bereits erkennen …
Chrome Extensions mit Transformers.js: KI direkt im Browser
Transformers.js ermöglicht es Entwicklern, Machine-Learning-Modelle direkt in Browser-Erweiterungen laufen zu lassen – ganz ohne Server-Backend. Dieser Guide zeigt, wie man eine …
Der Weg zum ersten Open-Source-Beitrag
Warum Open Source? Open-Source-Software ist überall, und GitHub ist ihr Zuhause. Wer einsteigen will, findet dort nicht nur Code, sondern eine Community. Der erste Beitrag ist oft …
Debian: Reproduzierbare Pakete sind jetzt Pflicht
Debian hat einen Meilenstein gesetzt: Pakete, die sich nicht reproduzierbar bauen lassen, werden nicht mehr nach Testing migriert. Supply-Chain-Security als Commitment, nicht als …
Trust Layer für Agenten: Validierung jenseits deterministischer Tests
Wenn “korrekt” nicht mehr deterministisch ist Moderne Software-Tests basieren auf einer Annahme: Korrektes Verhalten ist wiederholbar. Für autonome Agenten wie GitHub …
Geburtstagsparadoxon: Die Mathematik hinter Hash-Kollisionen
Intuition täuscht In einem Raum mit nur 23 Menschen besteht bereits eine 50%ige Wahrscheinlichkeit, dass zwei von ihnen am selben Tag Geburtstag haben. Das erscheint …
Warum Programmieren Theorie-Bilden ist – Ein verkannter Klassiker
Der vermisste Begriff Jani Hartikainen beschreibt seinen „Aha-Moment" beim Lesen von Peter Naurs Essay „Programming as Theory Building". Der dänische Informatiker prägte …
Agenten-Verhalten validieren ohne fragwürdige Tests
Moderne Softwaretests basieren auf der Annahme, dass korrektes Verhalten wiederholbar ist. Für deterministischen Code funktioniert das meist. Aber für autonome Agenten wie GitHub …
Gemini API Webhooks: Event-Driven für langlaufende Agenten
Google führt Webhooks für die Gemini API ein und eliminiert ineffizientes Polling bei langlaufenden Aufgaben. Kurzbeschreibung Event-Driven Webhooks informieren Entwickler …
Claude Limits verdoppelt: Anthropic und SpaceX Compute-Deal
Anthropic hat eine bedeutende Ankündigung gemacht: Höhere Nutzungslimits für Claude und eine strategische Partnerschaft mit SpaceX für massive neue Compute-Kapazität. Für Nutzer …
Flow Maps: Den Integral des Diffusionsmodells lernen
Diffusionsmodelle samplen durch iterative Schritte – das Denoiser-Netzwerk schätzt die Tangentenrichtung eines Pfades durch den Eingaberaum. Können wir Netzwerke trainieren, direkt …
GitHub Copilot CLI: Interactive vs Non-Interactive Mode
GitHub erklaert die zwei Modi der Copilot CLI: Interactive fuer iterative Arbeit, Non-Interactive fuer schnelle One-Shot Abfragen. Der Default: Interactive Mode Der Interactive …
GitHub Copilot CLI: Interaktiv vs. Non-Interaktiv
GitHub hat eine Serie für Copilot-CLI-Einsteiger gestartet. Der zweite Teil erklärt die zwei fundamentalen Modi: interaktiv und non-interaktiv. Beide haben ihre Berechtigung, …
KI hat deine Datenbank nicht gelöscht – du warst es
Ein viraler Tweet behauptete: Cursor/Claude habe die Produktionsdatenbank eines Unternehmens gelöscht. Der Entwickler fragte den Agenten nach dem “Warum” und wartete …
Warum Agentic Coding eine Falle ist
“Die KI macht das Coding, der Mensch orchestriert” – das ist der aktuelle Hype um Spec Driven Development. Der Artikel argumentiert, dass dieser Ansatz Entwickler in …
Google Translate wird 20: Eine KI-Erfolgsgeschichte
Google Translate feiert seinen 20. Geburtstag und blickt auf eine bemerkenswerte Evolution zurück. Was 2006 als statistisches Machine-Learning-Experiment begann, unterstützt heute …
HN SOTA: Coding-Modelle im Popularitäts-Ranking
Ein neues Open-Source-Tool namens HN SOTA ermöglicht es Entwicklern, den aktuellen Stand der Coding-Modelle-Popularität auf Hacker News zu verfolgen. Die Pipeline holt täglich die …
Specsmaxxing: Wie man Spezifikationen für KI-Agenten schreibt
Ein neues Paradigma für die KI-Entwicklung Kennst du das? Ein Feature funktioniert perfekt, dann fällt dir ein wichtiger Edge Case ein, und Claude antwortet: “Du hast völlig …
KI-Sicherheit verstehen: Prompt-Injection und Jailbreaks
Prompt-Injection ist eine der wichtigsten Sicherheitslücken in KI-Systemen. Um sich dagegen zu wehren, muss man verstehen, wie Angreifer vorgehen. Was ist Prompt-Injection? …
Waypoint-1.5: Interaktive Welten auf Consumer-Hardware
Overworld hat Waypoint-1.5 veröffentlicht, das nächste Echtzeit-Video-Weltmodell für interaktive generative Umgebungen. Das Ziel: Generative Welten auf die Hardware zu bringen, die …
Bugs, die Rust nicht findet
Rust gilt als sicherste Sprache für Systemprogrammierung – doch nicht alle Bugs fängt selbst der strikte Borrow-Checker. Ein neuer Artikel auf corrode.dev zeigt auf, welche …
Markdown meistern: Der GitHub-Guide für Einsteiger
Was ist Markdown und warum ist es wichtig? Markdown ist eine leichtgewichtige Auszeichnungssprache für Klartext. Auf GitHub kannst du Markdown in READMEs, Issues, Pull Requests und …
Armin Ronacher: Open Source vor und nach GitHub
Armin Ronacher, Schoepfer von Flask und Jinja2, veroeffentlicht einen ausfuehrlichen Rueckblick auf die Open-Source-Welt vor GitHub. Sein Fazit ist zugleich nostalgisch und …
Persönliches Command Center mit Copilot CLI bauen
Brittany Ellich, Staff Software Engineer im GitHub Billing-Team, hat ein praktisches Tool gebaut: ein persönliches Command Center, das alle ihre Apps in einem zentralen Dashboard …
Tutorial: Multi-Agent-Entwicklung mit Copilot Fleet
Die /fleet-Funktion der GitHub Copilot CLI revolutioniert die Entwicklungsarbeit. Statt Aufgaben nacheinander abzuarbeiten, können jetzt mehrere Sub-Agenten parallel operieren. …
Google und Kaggle starten AI Agents Vibe Coding Kurs
Nach dem Erfolg des ersten Kurses mit über 1,5 Millionen Teilnehmern bringt Google in Zusammenarbeit mit Kaggle den AI Agents Intensive Course zurück. Vom 15. bis 19. Juni 2026 …
Chromes Prompt API - KI direkt im Browser nutzen
Chromes Prompt API - KI direkt im Browser nutzen Google hat mit der Prompt API eine eingebaute KI-Schnittstelle in Chrome integriert. Sie ermöglicht Entwicklern, Sprachmodelle …
Code-Agenten für Open-Source-Beiträge richtig nutzen
2026: Code-Agenten funktionieren tatsächlich Was als Autocomplete am Rand des Editors begann, wurde zu Systemen, die aus knappen Spezifikationen funktionierende Lösungen liefern. …
GitHub Pages: Kostenlose Websites für jedes Projekt
Drei Dinge, die du brauchst Wusstest du, dass du Zugang zu einem kostenlosen und sicheren Hosting-Service auf GitHub hast? GitHub Pages verwandelt jedes Repository mit einer …
Transformers zu MLX portieren mit KI-Agenten
Hugging Face hat einen Skill und einen Test-Harness veröffentlicht, um Sprachmodelle von Transformers zu MLX-LM zu portieren. Das Ziel: Modelle sollen (fast) augenblicklich …
Graph Neural Networks: Eine sanfte Einführung
Graphen sind überall Graphen sind das natürliche Format für vernetzte Daten: soziale Netzwerke, Moleküle, Empfehlungssysteme, Wissensgraphen. Aber wie bringt man neuronale Netze …
Transformers.js in Chrome-Erweiterungen: Ein praktischer Leitfaden
Hugging Face hat einen detaillierten Leitfaden für die Integration von Transformers.js in Chrome-Erweiterungen unter Manifest V3 veröffentlicht. Am Beispiel einer Gemma-4-E2B …
TRL v1.0: Post-Training-Bibliothek für produktive Systeme
Hugging Face hat TRL v1.0 veröffentlicht. Die Bibliothek für Post-Training-Methoden hat sich von einem Forschungsprojekt zu produktionsreifer Infrastruktur entwickelt. Der …
KI und Cybersicherheit: Warum Offenheit ein strategischer Vorteil ist
Der Mythos-Bremser und die Zukunft der Software-Sicherheit Die Ankündigung von Anthropics Mythos und Project Glasswing hat eine wichtige Debatte ausgelöst: Wie verändert KI die …
Multimodale Embedding-Modelle trainieren mit Sentence Transformers
Warum Finetuning den Unterschied macht Allgemeine multimodale Embedding-Modelle wie Qwen3-VL-Embedding-2B sind auf diverse Daten trainiert – gut für Breite, selten optimal für …
Gemini API Flex & Priority: Kosten kontrollieren, Latenz managen
Zwei Tiers, ein Interface AI-Applikationen haben zwei Arten von Aufgaben: Interaktive Features mit User-Facing-Responsibility, und Background-Jobs, wo Latenz egal ist. Bisher …
Betrunken geschrieben: Was ein Senior Engineer wirklich gelernt hat
Flüssige Wahrheit Der Titel ist Programm: Ein Senior Engineer schreibt betrunken auf, was er in 10+ Jahren wirklich gelernt hat. Kein LinkedIn-Happy-Talk, kein “10 Steps to …
Florida verklagt OpenAI und Sam Altman wegen KI-Risiken
Florida hat eine Klage gegen OpenAI und CEO Sam Altman eingereicht und wirft dem Unternehmen vor, die Risiken künstlicher Intelligenz zu verschleiern. Die Klage richtet sich gegen …