Google DeepMinds KI-Mathematiker erreicht 48 % auf FrontierMath Tier 4
Google DeepMinds „AI Co-Mathematician" – eine zustandsbehaftete, asynchrone, mehrstufige agentische Forschungsumgebung – erzielte 48 % auf FrontierMath Tier 4, dem anspruchsvollsten mathematischen Reasoning-Benchmark, und setzt damit einen neuen Höchstwert. In aktiven Sitzungen wurden offene Forschungsprobleme gelöst und übersehene Zitierungen wiederentdeckt – eine Generalisierung auf Forschungsabläufe auf Expertenebene, bei denen Sitzungen Tage statt Minuten umspannen.
Einordnung
Mit 48 % auf der härtesten FrontierMath-Stufe (gegenüber 39–54 % für turnbasierte Konkurrenten) hat KI-gestützte Forschungsassistenz das Niveau erfahrener Mathematiker auf formalen Aufgaben erreicht. Das mehrstufige, sitzungsbeständige Design ist das Architekturmuster, das für langfristige agentische Arbeit richtungsweisend sein wird.