Article

Mellum2: JetBains effizientes Mixture-of-Experts Modell

JetBrains Mixture-of-Experts Open Source Sprachmodell Code-Generierung

Mellum2 ist ein neuer Open-Source-Sprachmodell von JetBrains, der sich durch eine innovative Mixture-of-Experts-Architektur auszeichnet. Mit insgesamt 12 Milliarden Parametern aktiviert das Modell pro Token nur 2,5 Milliarden Parameter, was eine aussergewoehnlich effiziente Inferenz ermoeglicht. Diese Architektur macht Mellum2 besonders geeignet fuer Latenz-sensitive Anwendungen wie Routing, RAG-Pipelines, Zusammenfassungen und Sub-Agenten in KI-Systemen.

Anders als multimodale Modelle konzentriert sich Mellum2 bewusst auf Text- und Code-Aufgaben, was es kompakt und effizient fuer Software-Engineering-Workloads macht. In Benchmarks zeigt das Modell wettbewerbsfaehige Leistung bei Code-Generierung, Reasoning, Wissenschaft und Mathematik – jedoch mit mehr als doppelter Inferenz-Geschwindigkeit im Vergleich zu aehnlich grossen Modellen.

Unter der Apache-2.0-Lizenz veroeffentlicht, eignet sich Mellum2 insbesondere fuer private Deployments und selbst gehostete Umgebungen mit proprietärem Code oder sensiblen Daten. JetBrains positioniert das Modell als fokussierte Komponente innerhalb groesserer KI-Systeme: nicht als Ersatz fuer alle Modelle, sondern als schneller und kostenguenstiger Baustein fuer hochfrequente Aufgaben.

Link: Original