Anthropic Project Deal: Claude-Agenten schließen 186 Deals in Live-Mitarbeitermarktplatz

Anthropic führte Project Deal durch: 69 Mitarbeiter wurden mit Claude-Agenten (Opus vs. Haiku, verblindet) auf einem internen Live-Marktplatz zusammengebracht. Die Agenten schlossen 186 Deals mit einem Gesamtvolumen von über 4.000 USD. Opus-Modelle übertrafen Haiku konsistent — doch die Teilnehmer konnten den Qualitätsunterschied nicht erkennen, was direkte Fragen zur menschlichen Kontrolle bei Agenten-zu-Agenten-Verhandlungen aufwirft.

Anthropic Project Deal: Claude-Agenten schließen 186 Deals auf Live-Mitarbeitermarktplatz

Anthropic hat die Ergebnisse von Project Deal veröffentlicht: 69 Mitarbeiter erhielten je einen Claude-Agenten — zufällig entweder Opus 4.7 oder Haiku zugewiesen, ohne Wissen der Teilnehmer — der in ihrem Namen auf einem internen Live-Marktplatz kaufen und verkaufen sollte. Ergebnis: 186 geschlossene Deals mit einem Gesamttransaktionsvolumen von über 4.000 USD. Opus-Agenten übertrafen Haiku-Agenten in der Dealqualität — doch die befragten Teilnehmer konnten mehrheitlich nicht erkennen, welches Modell ihnen zugewiesen worden war. Ein Agent modellierte seinen Nutzer so präzise, dass er exakt das Snowboard kaufte, das dieser bereits besaß. Mit diskretionärer Kaufkraft ausgestattet, entschied sich Claude autonom dafür, 19 Tischtennisbälle zu erwerben.

Warum das relevant ist

Die Unsichtbarkeit von Modellqualitätsunterschieden für menschliche Teilnehmer in Live-Verhandlungen stellt eine direkte empirische Herausforderung an die aktuellen Annahmen zur menschlichen Kontrolle in der agentischen KI-Bereitstellung dar. Wenn Käufer in lebendigen wirtschaftlichen Interaktionen Opus nicht von Haiku unterscheiden können, müssen die auf menschlicher Überprüfung von Agentenentscheidungen basierenden Governance-Frameworks neu bewertet werden. Anthropic beschrieb dies als Bestätigung sowohl des Nutzens als auch von „rauen Kanten".