Article

Ettin Reranker: Sechs neue Modelle für semantische Suche

Reranker Embeddings Hugging Face

Hugging Face veröffentlicht mit der Ettin Reranker-Familie sechs neue Cross-Encoder-Modelle, die State-of-the-Art-Performance in ihren jeweiligen Größenklassen erreichen. Die Modelle basieren auf den modernBERT-Encodern und decken Größen von 17M bis 1B Parameter ab.

Die sechs Varianten – 17M, 32M, 68M, 150M, 400M und 1B – ermöglichen Entwicklern eine granulare Auswahl zwischen Geschwindigkeit und Genauigkeit. Beim Pairing mit embeddinggemma-300m erreichen die Reranker auf dem MTEB(eng, v2) Retrieval-Benchmark konkurrenzfähige Ergebnisse mit deutlich größeren Modellen der Konkurrenz.

Das Training erfolgte mit einer Distillations-Methode: Pointwise MSE auf mxbai-rerank-large-v2 Scores über einem neu veröffentlichten Trainingsdataset cross-encoder/ettin-reranker-v1-data. Dieser Datensatz kombiniert lightonai/embeddings-pre-training mit einem umbewerteten Teil von lightonai/embeddings-fine-tuning.

Besonders wertvoll für die Community ist die offene Trainingsrezeptur – inklusive aller Trainingsdaten und Code. Das ermöglicht Nachtraining auf eigene Domänen und transparente Reproduktion der Ergebnisse. Ein spannender Aspekt ist die Integration in den neuen Agent Skill von Sentence Transformers v5.5.0, der die Fine-Tuning-Pipeline automatisiert.

Für RAG-Systeme und semantische Suchanwendungen bieten die Ettin Reranker eine effiziente Möglichkeit, die Qualität von Suchergebnissen signifikant zu verbessern – ohne die Inferenzkosten der grundsätzlichen Embedding-Modelle zu erhöhen.

Link: https://huggingface.co/blog/ettin-reranker