Article

Ettin Reranker: State-of-the-Art Reranking-Modelle von Hugging Face

Tom Aarsen veröffentlicht sechs neue CrossEncoder-Reranker in Sentence Transformers – State-of-the-Art bei ihren jeweiligen Modellgrößen.

Die Ettin Reranker Familie

Die neuen Modelle basieren auf den Ettin ModernBERT-Encodern und umfassen:

  • ettin-reranker-17m-v1 – Kleinstes Modell für Ressourcen-beschränkte Umgebungen
  • ettin-reranker-32m-v1 – Kompakt und effizient
  • ettin-reranker-68m-v1 – Ausgewogene Balance aus Performance und Größe
  • ettin-reranker-150m-v1 – Mittelgroßes Modell
  • ettin-reranker-400m-v1 – Für anspruchsvollere Anwendungen
  • ettin-reranker-1b-v1 – Größtes Modell mit maximaler Leistung

Training mit Distillation

Die Modelle wurden durch Distillation trainiert: Pointwise MSE auf mixedbread-ai/mxbai-rerank-large-v2 Scores über einen neuen Datensatz aus lightonai-Daten. Das Training-Rezept ist vollständig dokumentiert und der Datensatz öffentlich verfügbar.

Reranker für RAG-Pipelines

Reranker verbessern Retrieval-Ergebnisse, indem sie Query-Document-Paare direkt vergleichen und die relevantesten Dokumente an die Spitze setzen. In Kombination mit Embedding-Modellen wie embeddinggemma-300m erreichen sie auf dem MTEB-Benchmark hervorragende Ergebnisse.

Neue Agent Skill: train-sentence-transformers

Mit Sentence Transformers v5.5.0 gibt es einen neuen Agent Skill: hf skills add train-sentence-transformers ermöglicht es KI-Coding-Agenten wie Claude Code oder Codex, eigene SentenceTransformer-, CrossEncoder- oder SparseEncoder-Modelle zu trainieren.

from sentence_transformers import CrossEncoder
model = CrossEncoder("cross-encoder/ettin-reranker-1b-v1")
scores = model.predict([("query", "doc1"), ("query", "doc2")])

Originalartikel