Article

DeepInfra: Kostengünstiger Inference-Provider auf Hugging Face

deepinfra inference huggingface llm

DeepInfra ist jetzt offizieller Inference-Provider auf Hugging Face. Das Platform bietet mit über 100 Modellen eine der kostengünstigsten Token-Preise der Branche und integriert sich nahtlos in die Hugging Face SDKs.

Das Angebot

DeepInfra deckt ein breites Spektrum ab: LLMs für Text-Generierung, Text-to-Image, Text-to-Video, Embeddings und mehr. Zum Launch stehen Conversational- und Text-Generation-Tasks mit Modellen wie DeepSeek V4 Pro, Kimi-K2.6 und GLM-5.1 bereit. Weitere Task-Typen folgen in Kürze.

Wie die Integration funktioniert

Entwickler haben zwei Optionen: Eigene API-Keys direkt bei DeepInfra hinterlegen – dann laufen die Calls direkt zum Provider. Oder HF-Route verwenden – dann wird über das HuggingFace-Konto abgerechnet, ohne separaten DeepInfra-Token. In den User-Settings kann man Provider nach Präferenz ordnen, was sich auf Code-Snippets und Widgets auswirkt.

SDK-Nutzung

Python (huggingface_hub >= 1.11.2) und JavaScript (@huggingface/inference) unterstützen DeepInfra direkt. Ein Beispiel mit DeepSeek V4 Pro zeigt die einfache Integration: Client initialisieren, Provider setzen, Prompt senden – fertig.

Link: HuggingFace Blog