Google DeepMinds KI-Mathematiker erreicht 48 % auf FrontierMath Tier 4

Google DeepMinds „AI Co-Mathematician” – eine zustandsbehaftete, mehrstufige agentische Forschungsumgebung – erzielte 48 % auf FrontierMath Tier 4, dem anspruchsvollsten mathematischen Reasoning-Benchmark, und setzt damit einen neuen Höchstwert.

1 Min. Lesezeit|agenticonsult Intelligence

Google DeepMinds KI-Mathematiker erreicht 48 % auf FrontierMath Tier 4

Google DeepMinds „AI Co-Mathematician" – eine zustandsbehaftete, asynchrone, mehrstufige agentische Forschungsumgebung – erzielte 48 % auf FrontierMath Tier 4, dem anspruchsvollsten mathematischen Reasoning-Benchmark, und setzt damit einen neuen Höchstwert. In aktiven Sitzungen wurden offene Forschungsprobleme gelöst und übersehene Zitierungen wiederentdeckt – eine Generalisierung auf Forschungsabläufe auf Expertenebene, bei denen Sitzungen Tage statt Minuten umspannen.

Einordnung

Mit 48 % auf der härtesten FrontierMath-Stufe (gegenüber 39–54 % für turnbasierte Konkurrenten) hat KI-gestützte Forschungsassistenz das Niveau erfahrener Mathematiker auf formalen Aufgaben erreicht. Das mehrstufige, sitzungsbeständige Design ist das Architekturmuster, das für langfristige agentische Arbeit richtungsweisend sein wird.

Diskutieren aufLinkedIn X

Diese Eilmeldung wurde mit AI-Unterstuetzung aus der genannten Primaerquelle zusammengestellt. Sie dient der schnellen Lageorientierung — fuer die massgebliche Aussage bitte die Originalpublikation konsultieren.