Microsoft Research: 1.000 synthetische Computer für langfristiges Agenten-Training
Microsoft Research hat „1.000 synthetische Computer" veröffentlicht – einen Datensatz mit 1.000 vollständig konfigurierten virtuellen Umgebungen für das Training von Computer-Use-Agenten über lange Zeithorizonte. Jede Simulation liefert ca. 8 Stunden Agentenlaufzeit und ca. 2.000 Interaktionsrunden, was in etwa einem Monat komprimierter menschlicher Arbeit entspricht. Das System ist auf Milliarden synthetischer Welten skalierbar und stellt eine Trainingsdatenquelle für Computer-Use-Agenten bereit, die ohne echte Nutzertelemetrie auskommt – der einzige Ansatz, der DSGVO- und EU-AI-Act-Datenschutzanforderungen an die Trainingsdatenherkunft standhält.
Einordnung
Computer-Use-Agenten, die allgemeine Desktop-Umgebungen bedienen können, benötigen weit mehr Trainingsdaten als aufgabenspezifische Benchmarks liefern. Ein skalierbarer synthetischer Umgebungsgenerator, der Datenschutzanforderungen umgeht, ist ein fundamentaler Infrastrukturbeitrag – vergleichbar mit der Bedeutung, die ImageNet für Computer Vision hatte.