xAI Grok 4.3 und Mistral Medium 3.5 enttäuschen bei unabhängigen Benchmarks

Unabhängige Benchmark-Tests zeigen, dass xAI Grok 4.3 beta trotz behaupteter agentischer Verbesserungen hinter Kimi K 2.6, MiMu und den führenden geschlossenen Modellen zurückbleibt; Mistral Medium 3.5 (128B, 256K Kontext) erzielt auf Artificial Analysis deutlich schlechtere Ergebnisse als DeepSeek V4 und ist dabei teurer als vergleichbare offene Modelle.

1 Min. Lesezeit|agenticonsult Intelligence

xAI Grok 4.3 und Mistral Medium 3.5 enttäuschen bei unabhängigen Benchmarks

Unabhängige Evaluierungen auf Artificial Analysis zeigen, dass xAI Grok 4.3 beta trotz Marketing-Schwerpunkt auf agentischen Tool-Verbesserungen hinter Kimi K 2.6, MiMu (Xiaomi) und den führenden geschlossenen Modellen (GPT 5.5 u. a.) zurückbleibt. Mistral Medium 3.5 – ein 128B großes Dense-Modell mit 256K-Kontext – schneidet auf denselben Benchmarks deutlich schlechter ab als DeepSeek V4 und ist zugleich teurer als vergleichbare offene Modelle. Reviewer empfehlen Mistral Medium 3.5 ausschließlich für EU-regulierungskonforme Anwendungsfälle, bei denen europäische Modelle vorgeschrieben sind.

Einordnung

Zwei hochkarätige Releases, die selbstberichtete Benchmarks verfehlen, unterstreichen die Notwendigkeit unabhängiger Evaluation vor Beschaffungsentscheidungen – ein Muster, das bei Modellveröffentlichungen 2026 zur Routine wird.

Primaerquelle

AI Search (YouTube)

#grok #xai #mistral #ai-benchmarks #model-evaluation

Diskutieren aufLinkedIn X

Diese Eilmeldung wurde mit AI-Unterstuetzung aus der genannten Primaerquelle zusammengestellt. Sie dient der schnellen Lageorientierung — fuer die massgebliche Aussage bitte die Originalpublikation konsultieren.

Alle Live-News anzeigen

Live News Feed

13:20Irans Nobitex-Kryptobörse mit Kharrazi-Familie und US-Sanktionsumgehung verknüpft 13:19Trumps World Liberty: 550 Mio. USD eingesammelt, dann hunderte Millionen in privaten Token-Deals 13:18Google DeepMind Paper: KI wird niemals Bewusstsein erlangen – der Abstraktions-Trugschluss