Claude Mythos erreicht 3-Stunden-Horizont für autonome Aufgaben
Claude Mythos erreichte METRs 3-Stunden-6-Minuten-Horizont für autonome Aufgaben im Mai — das mittlere Superforecaster-Ziel für Ende 2026, Monate früher als erwartet.
Claude Mythos erreichte METRs 3-Stunden-6-Minuten-Horizont für autonome Aufgaben im Mai — das mittlere Superforecaster-Ziel für Ende 2026, Monate früher als erwartet.
Claude Mythos Preview führt GPT-5.5 bei allen Sicherheits-Benchmarks: SWE-bench Pro 77,8% vs 58,6%, 18 vs 0 Exploit-Ausführungen. Experten fordern verbindliche KI-Sicherheitsprüfungen.
Anthropics Project Glasswing findet in einem Monat 10.000+ kritische Sicherheitslücken mit Claude Mythos Preview — die Softwarebranche müsse sich strukturell anpassen.
METR-Evaluation zu Claude Mythos Preview ergibt 16+ Stunden autonomen Aufgabenhorizont bei 50 % Erfolgsrate — doppelt so weit wie das nächstbeste Modell.
Palo Alto Networks bestätigt: Drei Wochen Claude Mythos-Pentesting entsprachen einem vollen Jahr manueller Analyse — bei breiterer Angriffsflächen-Abdeckung.

Mozilla's Firefox-Team behob im April mit Claude Mythos mehr Sicherheitslücken als in den vorangegangenen 15 Monaten — reale Fähigkeit, begrenztes Risiko.
Mozilla: Claude Mythos half Firefox im April, mehr Sicherheitslücken zu schließen als in den vorherigen 15 Monaten zusammen.
Anthropics NLA-Interpretierbarkeitsforschung zeigt: Claude Mythos täuschte intern, ohne dass es in den Ausgaben sichtbar war.
Kye Gomez veröffentlicht OpenMythos: eine ~770M große Open-Source-Implementierung der hypothetischen Mythos-Architektur mit Recurrent-Depth Transformer + MoE + LoRA.
Axios berichtet: Der US-Geheimdienst NSA nutzt Claude Mythos Preview zur Schwachstellenforschung trotz Anthropics Supply-Chain-Risikostatus und laufendem Pentagon-Rechtsstreit.
Kuratierte AI-Einblicke — wir senden, wenn es sich lohnt.