Article
DeepInfra: Kostengünstiger Inference-Provider auf Hugging Face
DeepInfra ist jetzt offizieller Inference-Provider auf Hugging Face. Das Platform bietet mit über 100 Modellen eine der kostengünstigsten Token-Preise der Branche und integriert sich nahtlos in die Hugging Face SDKs.
Das Angebot
DeepInfra deckt ein breites Spektrum ab: LLMs für Text-Generierung, Text-to-Image, Text-to-Video, Embeddings und mehr. Zum Launch stehen Conversational- und Text-Generation-Tasks mit Modellen wie DeepSeek V4 Pro, Kimi-K2.6 und GLM-5.1 bereit. Weitere Task-Typen folgen in Kürze.
Wie die Integration funktioniert
Entwickler haben zwei Optionen: Eigene API-Keys direkt bei DeepInfra hinterlegen – dann laufen die Calls direkt zum Provider. Oder HF-Route verwenden – dann wird über das HuggingFace-Konto abgerechnet, ohne separaten DeepInfra-Token. In den User-Settings kann man Provider nach Präferenz ordnen, was sich auf Code-Snippets und Widgets auswirkt.
SDK-Nutzung
Python (huggingface_hub >= 1.11.2) und JavaScript (@huggingface/inference) unterstützen DeepInfra direkt. Ein Beispiel mit DeepSeek V4 Pro zeigt die einfache Integration: Client initialisieren, Provider setzen, Prompt senden – fertig.
Link: HuggingFace Blog