Claude Mythos: 16-Stunden-Horizont, Palo Alto Sicherheitsnachweis

Zwei unabhängige Datenpunkte schärfen das Fähigkeitsbild von Claude Mythos Preview. METR evaluierte im März 2026 eine frühe Vorabversion und maß einen 50%-Zeithorizont von mindestens 16 Stunden — mehr als doppelt so hoch wie das nächstbeste Modell. Palo Alto Networks berichtete separat, dass drei Wochen mit Mythos-gestützter Penetrationstestanalyse einer vollen Jahresleistung manueller Analyse bei größerer Abdeckung entsprachen. Beide Ergebnisse wurden am 8. und 9. Mai öffentlich und verleihen den Sicherheits- und Autonomieansprüchen des Modells eine dokumentierte Drittanbieter-Grundlage.

Was die Quellen tatsächlich besagen

METRs Bewertung basierte auf einer frühen Mythos-Preview-Version, die Anthropic für ein zeitlich begrenztes Risikoevaluierungsfenster bereitgestellt hatte. Der „50%-Zeithorizont" — jene Aufgabendauer, bei der das Modell die Hälfte der Aufgaben erfolgreich löst — lag bei mindestens 16 Stunden, mit einem 95%-Konfidenzintervall von 8,5 bis 55 Stunden. METR merkte an, das Modell stehe „am oberen Ende dessen, was wir ohne neue Aufgaben messen können" — ein Hinweis, dass die bestehenden Aufgabensammlungen selbst zur Engstelle werden. Alex Albert von Anthropic fasste dies als 2-fachen Vorsprung auf METRs 80%-Erfolgsrate-Benchmark gegenüber dem nächstbesten Modell zusammen.

Auf der Sicherheitsseite veröffentlichte Palo Alto Networks Ergebnisse, wonach drei Wochen Mythos-gestützter Analyse einer vollen Jahresleistung manueller Penetrationstests — bei breiterer Abdeckung — entsprachen. Der Befund wurde unabhängig von @alexalbert__, @techsnif und @emollick über zwei separate Observer-Batches am 8. und 9. Mai verbreitet. Ethan Mollick (Wharton) lieferte eine präzise Einordnung: Die Außenseiterbehauptung, Mythos könne keine Zero-Day-Exploits finden, war sachlich falsch; die Insider-Kritik, es handele sich nicht um einen „magischen Quantensprung in KI-Fähigkeiten", dürfte zutreffend sein. Gary Marcus ergänzte, dass Mythos auf EpochAIs ECI-Benchmark „nicht wesentlich besser als andere Modelle" sei — stärker bei der Fehlersuche, aber weiterhin mit Halluzinationen und Denkfehlern behaftet.

Strategische Einordnung

Der 16-Stunden-Zeithorizont bedeutet, dass Mythos mehrtägige autonome Arbeit ohne menschliche Eingriffe durchhalten kann — relevant für Teams, die langfristige Sicherheitsaudits, Code-Review-Pipelines oder Forschungsabläufe evaluieren. Das 20-fache Effizienzversprechen von Palo Alto (3 Wochen = 1 Jahr Pentesting) ist ein dokumentierter ROI-Anspruch, kein Benchmark-Marketing. Die domänenspezifische Stärke im Bereich Sicherheit und Code verallgemeinert sich nicht; agentenbasierte Deployments sollten entsprechend eingegrenzt werden.