Article

Ettin Reranker: Neue SOTA-Modelle für Semantische Suche

models reranker sentence-transformers ki

Sechs neue Reranker von 17M bis 1B Parametern

Tom Aarsen hat sechs neue CrossEncoder-Reranker unter dem Namen Ettin veröffentlicht, basierend auf den ModernBERT-Encoding-Modellen. Die Modelle sind durch Distillation von mixedbread-ai/mxbai-rerank-large-v2 trainiert und erreichen State-of-the-Art-Ergebnisse bei ihren jeweiligen Größen.

Die Modellfamilie

  • ettin-reranker-17m-v1 – Kleinste Variante, ideal für Edge-Deployment
  • ettin-reranker-32m-v1 – Kompakt für Low-Resource-Umgebungen
  • ettin-reranker-68m-v1 – Ausgewogene Balance zwischen Leistung und Ressourcen
  • ettin-reranker-150m-v1 – Mittelgroße Option
  • ettin-reranker-400m-v1 – Höhere Qualität
  • ettin-reranker-1b-v1 – Flagship-Modell

Was macht einen guten Reranker?

Reranker verbessern die Qualität der Retrieval-Ergebnisse, indem sie Dokumente neu ordnen, nachdem ein erstes Retrieval durchgeführt wurde. Sie arbeiten mit einem Query-Dokument-Paar und geben eine Relevanz-Score zurück. Kombiniert mit einem Embedding-Modell wie embeddinggemma-300m erreichen sie auf MTEB(eng, v2) Retrieval starke Ergebnisse.

Offenes Training

Neben den Modellen veröffentlicht Aarsen auch das Trainingsdatenset cross-encoder/ettin-reranker-v1-data und das vollständige Training-Rezept. Wer eigene Reranker trainieren möchte, kann die neue train-sentence-transformers Agent Skill nutzen.

Link: Original bei HuggingFace Blog