Article
OpenAI veröffentlicht GPT OSS als Open-Source-Modellfamilie
GPT OSS ist der lang erwartete Open-Weights-Release von OpenAI, entwickelt für leistungsstarke Reasoning-, Agenten- und vielseitige Entwickler-Anwendungen. Die Modellfamilie besteht aus zwei Varianten: einem großen Modell mit 117 Milliarden Parametern (gpt-oss-120b) und einem kleineren mit 21 Milliarden Parametern (gpt-oss-20b).
Technische Spezifikationen
Beide Modelle basieren auf der Mixture-of-Experts (MoE) Architektur und nutzen ein 4-Bit-Quantisierungsschema (MXFP4). Diese Kombination ermöglicht schnelle Inferenz durch weniger aktive Parameter bei gleichzeitig geringem Ressourcenverbrauch. Das große Modell passt auf eine einzelne H100-GPU, während das kleine Modell mit nur 16GB Arbeitsspeicher läuft – ideal für Consumer-Hardware und On-Device-Anwendungen.
Apache-2.0-Lizenz
Die Modelle sind unter der Apache-2.0-Lizenz veröffentlicht, begleitet von einer minimalen Nutzungsrichtlinie: “Wir streben an, dass unsere Werkzeuge sicher, verantwortungsvoll und demokratisch genutzt werden, während wir Ihre Kontrolle über deren Verwendung maximieren.”
Laut OpenAI ist dieser Release ein bedeutender Schritt in ihrem Engagement für das Open-Source-Ökosystem, im Einklang mit ihrer Mission, die Vorteile von KI breit zugänglich zu machen. Viele Anwendungsfälle erfordern private und lokale Deployments – genau hier setzt GPT OSS an.
Verfügbarkeit
Die Modelle sind auf Hugging Face verfügbar und unterstützen verschiedene Inference-Backends: transformers, llama.cpp, vLLM und vorgelagerte API-Zugänge über Inference-Provider. Fine-Tuning wird ebenfalls unterstützt, was die Modelle für eine breite Palette von Anwendungsfällen attraktiv macht.