Article

DeepInfra als neuer Inference-Provider auf Hugging Face

Hugging Face hat DeepInfra als neuen Inference-Provider in sein Ökosystem aufgenommen. DeepInfra ist eine serverlose KI-Inferenz-Plattform, die mit einem Katalog von über 100 Modellen eine der kostengünstigsten Preismodelle pro Token in der Branche anbietet.

Die Integration ermöglicht Entwicklern den Zugriff auf beliebte Open-Weight-LLMs wie DeepSeek V4, Kimi-K2.6 und GLM-5.1 direkt über die Hugging Face Hub-Modellseiten. Initial unterstützt DeepInfra Konversations- und Textgenerierungsaufgaben. Weitere Aufgaben wie Text-zu-Bild, Text-zu-Video und Embeddings werden in Kürze folgen.

Entwickler können DeepInfra über die Hugging Face SDKs nutzen. Für Python steht huggingface_hub ab Version 1.11.2 zur Verfügung, für JavaScript das Paket @huggingface/inference. Nutzer können entweder eigene API-Schlüssel für direkte Aufrufe beim Provider hinterlegen oder Anfragen über Hugging Face routen lassen, wobei die Gebühren direkt auf dem HF-Konto anfallen.

In der Benutzeroberfläche können Nutzer API-Schlüssel für verschiedene Provider hinterlegen und die bevorzugte Reihenfolge festlegen. Dies wirkt sich auf das Widget und die Code-Snippets auf den Modellseiten aus. Modellseiten zeigen kompatible Inference-Provider sortiert nach Benutzereinstellung an.

DeepInfra unterstützt ein breites Spektrum an Modelltypen und ergänzt damit die wachsende Liste serverloser Inferenz-Optionen auf Hugging Face direkt in den Arbeitsabläufen der Entwickler.

Link: https://huggingface.co/blog/inference-providers-deepinfra