Article

Ettin Reranker: State-of-the-Art für Semantic Search

Sechs neue Reranker-Modelle

Tom Aarsen von Hugging Face hat die Ettin Reranker-Familie veröffentlicht – sechs neue CrossEncoder-Reranker, die auf ModernBERT basieren und in ihren jeweiligen Größenklassen State-of-the-Art-Performance erreichen.

Die Modelle

Verfügbar sind sechs Varianten:

  • ettin-reranker-17m-v1 – die kompakte Version
  • ettin-reranker-32m-v1
  • ettin-reranker-68m-v1
  • ettin-reranker-150m-v1 – ausgewogene Balance
  • ettin-reranker-400m-v1
  • ettin-reranker-1b-v1 – die leistungsstarke Variante

Training-Rezept

Die Modelle wurden mit einem Distillations-Rezept trainiert: Pointwise MSE auf mxbai-rerank-large-v2 Scores mit einem kuratierten Dataset aus embeddings-pre-training und embeddings-fine-tuning. Das Training ist vollständig reproduzierbar.

Warum Reranker?

Reranker verbessern Retrieval-Ergebnisse erheblich. Während Embeddings einen ersten Kandidaten-Satz liefern, bewertet der Reranker diese Kandidaten erneut und sortiert sie nach Relevanz. Die Kombination aus Embedder + Reranker liefert deutlich präzisere Ergebnisse als Embeddings allein.

Benchmark-Ergebnisse

Auf MTEB(eng, v2) Retrieval zeigen die Modelle in Kombination mit embeddinggemma-300m Spitzenleistung. Besonders beeindruckend: Auch die kleineren Modelle (17M, 32M) liefern überraschend gute Ergebnisse bei minimalem Rechenaufwand.

Integration

Die Modelle sind über Sentence Transformers verfügbar und lassen sich einfach in existierende RAG-Pipelines integrieren. Für diejenigen, die eigene Reranker trainieren möchten, ist auch der Code und das Trainings-Dataset verfügbar.

Originalartikel