Article

Ettin Reranker: State-of-the-Art Reranking

May 28, 2026 HuggingFace Reranker RAG Suche Embeddings

Tom Aarsen hat auf dem Hugging Face Blog die Ettin Reranker-Familie vorgestellt – sechs neue Cross-Encoder-Reranker, die State-of-the-Art-Performance bei ihren jeweiligen Modellgrößen liefern. Die Modelle basieren auf den Ettin ModernBERT-Encodern und werden gemeinsam mit den Trainingsdaten und dem vollständigen Trainings-Rezept veröffentlicht.

Verfügbare Modelle

Die Familie umfasst sechs Varianten:

cross-encoder/ettin-reranker-17m-v1
cross-encoder/ettin-reranker-32m-v1
cross-encoder/ettin-reranker-68m-v1
cross-encoder/ettin-reranker-150m-v1
cross-encoder/ettin-reranker-400m-v1
cross-encoder/ettin-reranker-1b-v1

Die Modelle wurden mit einem Distillations-Rezept trainiert: Pointwise MSE auf mixedbread-ai/mxbai-rerank-large-v2-Scores über einem Subset der lightonai-Embedding-Datasets.

Was ist ein Reranker?

Reranker verbessern das Retrieval-Ergebnis von Embedding-basierten Suchsystemen. Während Embeddings Ähnlichkeit zwischen Query und Dokumenten voraussagen, nutzt ein Cross-Encoder Reranker den vollen Kontext von Query und Dokument zusammen. Das führt zu präziseren Rankings auf Kosten höherer Latenz.

In einem typischen RAG-Workflow werden zuerst mit Embeddings die relevantesten Dokumente gefunden, dann rerankt der Cross-Encoder diese Top-Kandidaten für das finale Ranking.

Trainings-Rezept verfügbar

Besonders wertvoll: Alle Trainingsdaten und das komplette Rezept werden veröffentlicht. Das ermöglicht Entwicklern, eigene Reranker auf ihre spezifischen Daten und Use-Cases zu trainieren.

Link zum Original: huggingface.co