Matt Pococks Gegenthese: Die Codebasis ist die Decke des Agenten

Zwei Stunden in einen vollständigen AI-Engineer-Workshop gelangt Matt Pocock zur zentralen These: „KI ist ein neues Paradigma" ist der falsche Rahmen für Engineering-Produktivität. Der richtige Rahmen ist, dass 30 Jahre alte Software-Grundlagen — kleine Aufgaben, vertikales Slicing, TDD, tiefe Module, beobachtbare Feedback-Schleifen — unter KI wichtiger sind, nicht weniger wichtig, weil die Obergrenze des Modells durch die Qualität des Codes, in dem es arbeitet, und durch die Feedback-Schleifen, die man ihm zugänglich gemacht hat, begrenzt wird. Die Codebasis ist die Decke des Agenten. Den Prompt zu verbessern, erhöht sie nicht.

Was die Quelle tatsächlich sagt

Der Workshop baut eine vollständige Produktionsmethodik von einem Slack-Nachrichten-Client-Brief bis zur Veröffentlichung auf. Die operativ wichtigsten Elemente:

Smart Zone vs. Dumb Zone. LLMs bauen merklich nach etwa 100.000 Tokens ab, unabhängig vom beworbenen Kontextfenster — ein 1M-Kontextfenster bedeutet schlicht „mehr Dumb Zone". Pocock überwacht den Token-Count über eine Claude-Code-Statuszeile und entwirft Aufgaben so, dass sie in die Smart Zone passen. Komprimierung wird explizit abgelehnt: Sie erzeugt Sediment, das das nachfolgende Reasoning still degradiert. Die bevorzugte Alternative ist das vollständige Löschen des Kontexts und die Rehydrierung aus dauerhaften Artefakten (PRDs, GitHub-Issues).

Verhör-mich vor dem Schreiben. Ein kleiner Skill, der das Modell zwingt, den Entwickler unerbittlich zu befragen, bis ein gemeinsames Design-Konzept erreicht ist — typischerweise 40–100 Fragen. Der Gesprächsverlauf ist das Asset, nicht die resultierende Spezifikation. Dieser Schritt ist der einzige, den Pocock als nicht delegierbar kennzeichnet: „Man kann Verstehen nicht delegieren."

Vertikale Slices statt horizontaler Schichten. Die natürliche Betriebsart von KI ist horizontales Kodieren (vollständige Datenbank → vollständige API → vollständige UI), was integriertes Feedback auf die dritte Phase verschiebt. Tracer-Bullet-Vertikale-Slices — schmale Pfade durch alle Schichten, am Ende jedes Issues sichtbar — sind nicht verhandelbar, weil Feedback-Schleifenqualität die Obergrenze der KI-Qualität ist.

TDD als Betrugs-Prävention. Modelle schreiben zuerst die Implementierung und dann Tests dagegen, wenn sie die Gelegenheit bekommen. Red-Green-Refactor-Disziplin, bei der der Test vor der Implementierung verfasst wird, ist strukturell schwerer zu unterlaufen und produziert auf ausgereiften Codebases dramatisch bessere Ausgabequalität.

Strategische Einschätzung

Die direkte Herausforderung an „Vibe Coding" im Maßstab ist gut getimed — in derselben Woche demonstriert BridgeMind 12-paralleles-Agenten-Vibe-Coding bei 128.000 $ ARR auf einer Tauri-Desktop-App. Beide produzieren funktionierende Software. Pococks These ist, dass Vibe Coding technische Schulden in dem Tempo anhäuft, in dem KI-Adoption die Feature-Velocity verstärkt, und dass die Schulden plötzlich ankommen, wenn die Codebasis für den Agenten zu flach zum Navigieren geworden ist. Der praktische Einstiegspunkt ist sein öffentliches Methodologie-Repo, das die Verhör-mich-, PRD- und Kanban-Skills als sofort installierbare Tools ausliefert.