Article

Semble: Code-Suche für KI-Agenten mit 98% weniger Tokens

May 18, 2026 tools github claude mcp

Token-effiziente Code-Recherche für Agenten-Workflows

Ein neues Open-Source-Tool namens Semble versucht ein grundlegendes Problem bei KI-gestützter Codeentwicklung zu lösen: Wenn Agenten nichts direkt finden können, greifen sie auf grep zurück, lesen komplette Dateien oder starten Sub-Agenten. Das verbraucht massenhaft Tokens und findet oft trotzdem nicht den relevanten Code.

Semble kombiniert statische Model2Vec-Embeddings mit BM25, fusioniert via RRF und rerankt mit code-aware Signalen. Da keine Transformer zum Einsatz kommen, läuft alles auf der CPU. Das Ergebnis: Auf einem Benchmark mit etwa 1250 Query-Dokument-Paaren über 63 Repositories und 19 Sprachen verbraucht Semble 98 Prozent weniger Tokens als grep+read und erreicht 99 Prozent der Retrieval-Qualität eines 137M-Parameter-Code-Transformers – bei 200-facher Geschwindigkeit.

Die Eckdaten: Etwa 250ms zum Indexieren eines typischen Repositorys, 1,5ms pro Query auf der CPU. Als MCP-Server lässt es sich drop-in in Claude Code, Cursor, Codex und OpenCode integrieren.

Die Installation erfolgt mit einem einzigen Befehl für Claude Code: claude mcp add semble -s user -- uvx --from "semble[mcp]" semble. Keine API-Keys, keine GPU, keine externen Dienste erforderlich.

Link: Original bei GitHub