Google Research veröffentlicht ReasoningBank: Agenten-Gedächtnis aus Fehlern und Erfolgen

Google Research hat ReasoningBank veröffentlicht – ein Agenten-Gedächtnissystem, das validierte Strategien aus Erfolgs-Trajektorien und Lektionen aus Misserfolgs-Trajektorien getrennt extrahiert. Ergebnisse: +8,3 Prozentpunkte auf WebArena und 54 % → 57,4 % auf SWE-Bench-Verified bei nur +4,3 % Token-Overhead.

Google Research veröffentlicht ReasoningBank: Agenten-Gedächtnis aus Fehlern und Erfolgen

Google Research hat ReasoningBank veröffentlicht – ein Agenten-Gedächtnissystem, das Lernprozesse aus Erfolgs- und Misserfolgs-Trajektorien getrennt behandelt. Frühere Systeme (Synapse, AWM) speicherten ausschließlich Erfolge; das Hinzufügen von Misserfolgen zu AWM führte zu einem Genauigkeitsrückgang von -2,2 %. ReasoningBank begegnet diesem Problem, indem es aus Erfolgen validierte Strategien und aus Misserfolgen diskrete Lektionen extrahiert und beide von spezifischen Website-Kontexten abstrahiert, sodass Strategien generalisieren. Ergebnisse: +8,3 Prozentpunkte WebArena-Erfolgsrate mit Gemini-2.5-flash, 54 % → 57,4 % auf SWE-Bench-Verified bei +4,3 % Token-Overhead. MaTTS (Memory-aware Test-Time Scaling) baut darauf eine selbstverstärkende Lernschleife auf.

Einordnung

Misserfolgs-Trajektorien als erstklassiges Lernsignal statt als Rauschen zu behandeln, ist ein struktureller Fortschritt im Agenten-Gedächtnis-Design mit unmittelbaren Implikationen für langfristig betriebene agentische Systeme.