Metas Muse Spark startet – Gemini führt weiterhin

Meta hat Muse Spark am 9. April 2026 gestartet — ein nativ multimodales KI-Modell von Meta Superintelligence Labs, das GPT 5.4 bei Gesundheits-Benchmarks schlägt, aber hinter Gemini 3.1 Pro zurückbleibt.

Das Wichtigste in Kürze

Meta Muse Spark wurde am Mittwoch auf meta.ai und in der Meta AI App gestartet und wird in den kommenden Wochen auf Facebook, Instagram und WhatsApp ausgerollt
Muse Spark erzielte 42.8 bei HealthBench Hard — und übertraf damit GPT 5.4 (40.1) und Gemini 3.1 Pro (20.6) beim medizinischen Schlussfolgern
Gemini 3.1 Pro führt weiterhin beim abstrakten Schlussfolgern (76.5 vs 42.5 bei ARC AGI 2), beim Programmieren und beim multimodalen Verständnis
Die Meta-Aktie stieg um 6.5% am Mittwoch und schloss nach der Ankündigung bei $612.42

Meta Muse Spark ist da — und das Unternehmen will deutlich machen, dass es sich um eine völlig neue Ära handelt, nicht nur um ein weiteres Llama-Update. Von Meta Superintelligence Labs in neun Monaten entwickelt, ging das Modell am Mittwoch auf meta.ai und in der Meta AI App live, wobei Facebook, Instagram und WhatsApp in den kommenden Wochen folgen. Für 3.5 Milliarden potenzielle Nutzer ist das kein leiser Start. Das ist ein Statement.

Was unterscheidet Muse Spark von Llama?

Muse Spark ist nativ multimodal — das bedeutet, es wurde von Anfang an dafür konzipiert, Bilder, Text und Sprache gemeinsam zu verarbeiten, anstatt Bildfähigkeiten nachträglich an ein bestehendes Sprachmodell anzubauen. Dieser Unterschied ist wichtiger, als er klingt. Die meisten Frontier-Modelle begannen als reine Textsysteme, denen später Bilderkennung hinzugefügt wurde. Muse Spark nicht.

Das Modell verfügt über visuelle Chain-of-Thought-Schlussfolgerung, Tool-Nutzung und was die Muse Spark-Dokumentation als 'Contemplating-Modus' beschreibt — ein Setup, das mehrere KI-Agenten parallel laufen lässt, um komplexere Probleme zu lösen. Man kann es als Metas Antwort auf Googles Gemini Deep Think und OpenAIs erweiterten Reasoning-Modus betrachten. Wenn der Contemplating-Modus aktiviert ist, erreichte Muse Spark 58% bei Humanity's Last Exam und 38% bei FrontierScience Research — ein Bereich, der es in dieselbe Liga wie die Premium-Stufen seiner Konkurrenten bringt, nicht die Standardversionen.

Es gibt eine bemerkenswerte Kehrtwende bei diesem Launch: Muse Spark ist Closed Source. Keine öffentlichen Gewichte, keine Architektur-Veröffentlichung. Für ein Unternehmen, das sich mit der offenen Llama-Reihe erhebliche Glaubwürdigkeit aufgebaut hat, ist das ein Kurswechsel, den man im Auge behalten sollte. Meta sagt, man hoffe, zukünftige Muse-Versionen als Open Source zu veröffentlichen. Aber nach der verhaltenen Aufnahme von Llama 4 Anfang des Jahres schreiben sie diesmal offensichtlich ein neues Drehbuch.

Muse Spark ist der erste Schritt auf unserer Skalierungsleiter und das erste Produkt einer grundlegenden Neuausrichtung unserer KI-Bemühungen. Um die weitere Skalierung zu unterstützen, tätigen wir strategische Investitionen über den gesamten Stack hinweg — von der Forschung und dem Modelltraining bis hin zur Infrastruktur, einschließlich des Hyperion-Rechenzentrums.

— Meta, offizielle Ankündigung

Wo Muse Spark gewinnt — und wo es geschlagen wird

Das Benchmark-Bild ist wirklich gemischt, und das ist es wert, genauer betrachtet zu werden. Beim medizinischen Schlussfolgern ist Muse Spark der klare Spitzenreiter. Meta arbeitete mit mehr als 1,000 Ärzten zusammen, um Gesundheits-Trainingsdaten zu kuratieren, und die Ergebnisse bei HealthBench Hard zeigen es: 42.8 für Muse Spark gegenüber 40.1 für GPT 5.4 und nur 20.6 für Gemini 3.1 Pro. Der Abstand zu Gemini ist nicht marginal — er ist erheblich. Bei der agentischen Suche über DeepSearchQA führt Muse Spark ebenfalls mit 74.8 und liegt damit vor Gemini (69.7) und GPT 5.4 (73.6). Bei CharXiv Reasoning — dem Verständnis von Abbildungen aus wissenschaftlichen Arbeiten — erzielte es 86.4, den höchsten Wert aller drei Modelle.

Dann gibt es allerdings ARC AGI 2, den Benchmark für abstraktes Schlussfolgern, der sich zu einer Art Kurzformel für die reine KI-Leistungsfähigkeit entwickelt hat. Gemini erzielte 76.5. Muse Spark erzielte 42.5. Das ist keine Lücke — das ist ein Abgrund. Beim Programmieren zeigt sich ein ähnliches Bild: LiveCodeBench Pro hat Gemini bei 82.9 gegenüber Muse Sparks 80.0, und bei MMMU Pro für multimodales Verständnis schlägt Geminis 83.9 Metas 80.4. Metas eigener Blog räumt diskret Leistungslücken bei langfristigen agentischen Aufgaben und Programmier-Workflows ein. Anerkennung dafür, das Offensichtliche offen auszusprechen.

Also: Muse Spark gewinnt bei Gesundheit und agentischer Suche. Gemini gewinnt beim abstrakten Schlussfolgern, Programmieren und multimodaler Breite. Keines der beiden ist universell das Beste. Es kommt auf den Anwendungsfall an.

Die $14-Milliarden-Wette hinter Muse Spark

Meta Superintelligence Labs — das Team, das Muse Spark gebaut hat — wurde vor neun Monaten nach Metas Übernahme von Scale AI für $14 Milliarden zusammengestellt, wobei Alexandr Wang als Chief AI Officer einstieg. Neun Monate vom Startschuss bis zum Launch eines Frontier-Modells ist schnell, selbst nach Tech-Maßstäben. Intern unter dem Codenamen Avocado bekannt, stützte sich das Projekt auf einen neuen Pretraining-Stack, der laut Meta das Leistungsniveau von Llama 4 Maverick mit über 10-mal weniger Rechenleistung erreichen kann. Wenn diese Effizienzbehauptung einer Überprüfung standhält, ist sie für die Wirtschaftlichkeit des KI-Wettrüstens ebenso bedeutsam wie für jeden Benchmark.

Der Markt nahm dies zur Kenntnis. Die Meta-Aktie stieg während der Mittwochssitzung um fast 9%, bevor sie sich bei einem Zugewinn von 6.5% einpendelte und bei $612.42 schloss. Das ist der Markt, der die Möglichkeit einpreist, dass dies mehr als eine Produktauffrischung ist — dass Meta nach einem Jahr des Aufholens tatsächlich wieder ins Rennen um Frontier-Modelle eingestiegen ist.

Es gibt auch eine kommerzielle Ebene, die nicht genug Beachtung findet. Muse Spark wird mit einem Shopping-Assistenten ausgeliefert, der Produkte vergleicht und direkt zum Kauf weiterleitet. Mit 3.5 Milliarden aktiven Nutzern auf Metas Plattformen ist das ein KI-Monetarisierungsansatz, den weder Google noch OpenAI in derselben Social-Graph-Größenordnung replizieren können. Der System-Prompt des Modells wurde innerhalb von Minuten nach dem Launch extrahiert — eine Erinnerung daran, dass 'Closed Source' und 'undurchdringlich' nicht dasselbe sind. Eine private API-Vorschau wird für ausgewählte Entwickler geöffnet, was darauf hindeutet, dass Muse Spark als Plattform positioniert wird, nicht nur als Verbraucherprodukt.

Was bedeutet Muse Spark für KI-Investoren und Kryptomärkte?

Für alle, die KI-Infrastruktur-Investments verfolgen, ist die Behauptung zur Recheneffizienz die wichtigste Schlagzeile. Meta sagt, der neue Pretraining-Stack erreiche das Leistungsniveau von Llama 4 Maverick mit 10-mal weniger Rechenleistung. Wenn sich das auf das nächste Modell der Muse-Familie skalieren lässt — das sich Berichten zufolge bereits in der Entwicklung befindet — verschiebt sich die Kostenkurve für Frontier-KI auf eine Weise, die die Kapitalallokation in der gesamten Branche verändert.

Die Closed-Source-Entscheidung signalisiert ebenfalls etwas: Meta ist es leid, seine besten Arbeiten an Wettbewerber zu verschenken, die sie kommerziell einsetzen. Open Source war eine großartige Strategie, als Llama noch aufholte. Jetzt, da Meta versucht zu führen, sehen die Anreize anders aus. Ob man es Reifung nennt oder einen defensiven Burggraben — die Ära, in der Meta Frontier-Gewichte an die Welt verschenkt, scheint vorerst auf Eis zu liegen.

Muse Spark wird intern als 'klein und schnell' beschrieben — die erste Stufe auf der Muse-Skalierungsleiter. Das bedeutet, dass der eigentliche Test für Metas KI-Ambitionen nicht der Launch am Mittwoch ist. Es ist das, was als Nächstes kommt.

Häufig gestellte Fragen

Was ist Meta Muse Spark?

Muse Spark ist Metas bisher leistungsfähigstes KI-Modell, das am 8. April 2026 gestartet wurde. Von Meta Superintelligence Labs entwickelt, ist es nativ multimodal — verarbeitet Text, Bilder und Sprache von Grund auf — und verfügt über visuelle Chain-of-Thought-Schlussfolgerung, Tool-Nutzung und einen parallelen Agenten-'Contemplating-Modus' für komplexe Aufgaben.

Wie schneidet Muse Spark im Vergleich zu Gemini 3.1 Pro ab?

Muse Spark übertrifft Gemini 3.1 Pro beim medizinischen Schlussfolgern (42.8 vs 20.6 bei HealthBench Hard) und bei der agentischen Suche. Gemini 3.1 Pro führt weiterhin beim abstrakten Schlussfolgern — mit 76.5 gegenüber 42.5 bei ARC AGI 2 — sowie bei Programmier- und multimodalen Verständnis-Benchmarks.

Ist Muse Spark Open Source wie Llama?

Nein. Muse Spark ist ein geschlossenes Modell — seine Gewichte und Architektur werden nicht öffentlich freigegeben. Das ist eine Abkehr von Metas Llama-Reihe. Meta hat erklärt, man hoffe, zukünftige Muse-Versionen als Open Source zu veröffentlichen, aber der Code des aktuellen Modells bleibt privat.

Was ist Meta Superintelligence Labs?

Meta Superintelligence Labs ist die KI-Forschungsabteilung, die Meta vor neun Monaten nach der Übernahme von Scale AI für $14 Milliarden zusammengestellt hat. Chief AI Officer Alexandr Wang leitet das Team, das Muse Spark von Grund auf mit einem neuen Pretraining-Stack entwickelt hat, der laut Meta über 10-mal recheneffizienter ist als der Trainingsprozess von Llama 4.