Article
Ettin Reranker: Neue SOTA-Modelle für Semantische Suche
Sechs neue Reranker von 17M bis 1B Parametern
Tom Aarsen hat sechs neue CrossEncoder-Reranker unter dem Namen Ettin veröffentlicht, basierend auf den ModernBERT-Encoding-Modellen. Die Modelle sind durch Distillation von mixedbread-ai/mxbai-rerank-large-v2 trainiert und erreichen State-of-the-Art-Ergebnisse bei ihren jeweiligen Größen.
Die Modellfamilie
- ettin-reranker-17m-v1 – Kleinste Variante, ideal für Edge-Deployment
- ettin-reranker-32m-v1 – Kompakt für Low-Resource-Umgebungen
- ettin-reranker-68m-v1 – Ausgewogene Balance zwischen Leistung und Ressourcen
- ettin-reranker-150m-v1 – Mittelgroße Option
- ettin-reranker-400m-v1 – Höhere Qualität
- ettin-reranker-1b-v1 – Flagship-Modell
Was macht einen guten Reranker?
Reranker verbessern die Qualität der Retrieval-Ergebnisse, indem sie Dokumente neu ordnen, nachdem ein erstes Retrieval durchgeführt wurde. Sie arbeiten mit einem Query-Dokument-Paar und geben eine Relevanz-Score zurück. Kombiniert mit einem Embedding-Modell wie embeddinggemma-300m erreichen sie auf MTEB(eng, v2) Retrieval starke Ergebnisse.
Offenes Training
Neben den Modellen veröffentlicht Aarsen auch das Trainingsdatenset cross-encoder/ettin-reranker-v1-data und das vollständige Training-Rezept. Wer eigene Reranker trainieren möchte, kann die neue train-sentence-transformers Agent Skill nutzen.