# agentic-ai

17. Mai 20261 Min. Lesezeit

Google DeepMinds KI-Mathematiker erreicht 48 % auf FrontierMath Tier 4

Google DeepMinds KI-Mathematiker erzielt 48 % auf FrontierMath Tier 4 – neuer Rekord – und löste offene Forschungsprobleme in mehrstufigen Echtzeit-Sitzungen.

3D-Rendering eines präzisen KI-Harness-Gerüsts, das einen neuronalen Kern umhüllt, mit konkurrierenden Modell-Leistungstürmen im Hintergrund

TechnologieErheblich

KI-Harness wird 2026 zum dominanten Leistungsfaktor

Ein 32.000-GPU-Stunden-Benchmark bestätigt: Die Harness-Architektur überwiegt die Modellauswahl — sechs unabhängige Quellen konvergieren auf denselben Befund.

17. Mai 20262 Min. Lesezeit

12. Mai 20261 Min. Lesezeit

Anthropic veröffentlicht Agent View in Claude Code

Claude Code von Anthropic erhält Agent View: ein Multi-Session-Dashboard für parallele Agenten mit Statusanzeige und Hintergrundausführung.

10. Mai 20261 Min. Lesezeit

Experian: 40 % der 2025-Datenpannen KI-gestützt; Agentic AI ist die Nr.-1-Bedrohung 2026

Experian: 40 % der 5.000 Datenpannen 2025 waren KI-gestützt; Agentic AI wird als die größte Bedrohung für 2026 vorhergesagt.

Cinematisches Rendering eines autonomen KI-Agenten, der bei Nacht ein versagendes Enterprise-Sicherheitsgateway in einem Serverraum überwindet

StrategieBedeutsam

McKinseys $20-Angriff: Agentische KI als führender Sicherheitsvektor 2026

Ein autonomer Agent für $20 legte McKinseys Lily-Plattform offen. Experian-Daten bestätigen: Agentische KI ist der führende Bedrohungsvektor des Jahres 2026.

10. Mai 20262 Min. Lesezeit

Branchebreaking

Cloudflare streicht 1.100 Stellen und nennt agentisches KI-Modell als Grund

Cloudflare streicht ein Fünftel der Belegschaft wegen agentischem KI-Umbau — erster großer Infrastrukturanbieter dieser Art.

8. Mai 20261 Min. Lesezeit

5. Mai 20261 Min. Lesezeit

Anthropic kündigt kostenlose 'Code with Claude' Entwickler-Konferenz an

Anthropics 'Code with Claude' ist eine kostenlose Livestream-Entwicklerkonferenz mit Demos, Workshops und Ingenieur-Talks zu Claude Code in Produktionsworkflows.

4. Mai 20261 Min. Lesezeit

LeCun: Agentische KI auf LLMs zu bauen ist ein 'Rezept für eine Katastrophe'

Metas LeCun: Agentische Systeme auf LLMs sind ein 'Rezept für eine Katastrophe' — eine markante Kursänderung eines der einflussreichsten KI-Forscher.

Dominantes KI-Token über einem Wettbewerbsraster mit sechs Hackathon-Gewinner-Icons im Hintergrund

TechnologieBemerkenswert

Claude Opus 4.7 dominiert Coding-Benchmark und gewinnt Hackathon mit sechs Projekten

Ein wissenschaftlicher AlphaZero-Benchmark und ein globaler Hackathon bestätigen übereinstimmend Claude Opus 4.7 als aktuellen Frontier in agentic Coding.

30. April 20262 Min. Lesezeit

29. April 20261 Min. Lesezeit

Nvidia veröffentlicht Nemotron 3 Nano Omni: Offenes multimodales Modell

Nvidias Nemotron 3 Nano Omni ist ein offenes multimodales 30B-A3B-MoE-Modell für agentische KI mit Vision- und Sprachfähigkeiten.

28. April 20261 Min. Lesezeit

Agentic World Modeling Paper: Grundlagen, Fähigkeiten und Regulierungsprinzipien

Ein neues Paper auf HuggingFace behandelt Agentic World Modeling: Grundlagen, Fähigkeitsanforderungen und Regulierungsprinzipien für KI-Agenten in offenen Umgebungen.

27. April 20261 Min. Lesezeit

Autogenesis-Protokoll bringt überprüfbare Selbstevolution zu Produktionsagenten

Autogenesis ermöglicht Agenten überprüfbare Selbstmodifikation: Fähigkeitslücken erkennen, Verbesserungen generieren und testen, mit vollständigem Verlauf und Rollback integrieren.

27. April 20261 Min. Lesezeit

Diversity-Collapse-Paper formalisiert Multi-Agenten-LLM-Homogenisierung

Forschung formalisiert 'Diversity Collapse': Multi-Agenten-LLM-Systeme homogenisieren Ausgaben durch strukturelle Kopplung – Brainstorming-Setups müssen explizit für Heterogenität entwickelt werden.

Zwei präzise Modulstapel verzahnen sich auf obsidianfarbenem Untergrund, kühltürkise Streuung, eingravierte 1M-Beschriftung

TechnologieBemerkenswert

DeepSeek-V4 und Kimi-K2.6 verschieben die Open-Weights-Basis für KI-Agenten

DeepSeek-V4 (MIT, 1M-Kontext) und Kimi-K2.6 (multimodal, 256K-Kontext) bilden den ersten vollständigen Open-Weights-Stack für KI-Agenten.

27. April 20262 Min. Lesezeit

Zentraler Orchestrator-Knoten, der Bogenlinien zu einem Schwarm peripherer Agenten-Cluster auf dunkelblauem Hintergrund ausstrahlt

TechnologieBemerkenswert

Kimi K2.6 wird Open-Source-Nummer-1 mit 300-Agenten-Schwärmen

Moonshot AIs Kimi K2.6 führt das Open-Source-Ranking mit 300 parallelen Sub-Agenten und einem 12-Stunden-Coding-Marathon an.

26. April 20262 Min. Lesezeit

Dunkler Operationskorridor mit elektrisch-blauen Agenten-Pipeline-Knoten und einem leuchtend bernsteinfarbenen Sicherheitsprüfpunkt

BrancheErheblich

GPT-5.5: Agentic-First-Modell, 82 % Terminal-Bench, Sicherheitsstufe HIGH

OpenAIs GPT-5.5 erscheint sechs Wochen nach 5.4 mit +7 Pkt. Terminal-Bench, verdoppelten Preisen und Cyber/Bio-Sicherheitseinstufungen auf HIGH.

26. April 20262 Min. Lesezeit

Strategiebreaking

Strider nutzt agentenbasierte KI für US Air Force und NATO zur Akteursidentifikation

Bloomberg porträtiert Strider, das agentenbasierte KI und öffentliche Daten nutzt, um ausländische Staatsakteure für US Air Force und NATO zu identifizieren.

26. April 20261 Min. Lesezeit

25. April 20261 Min. Lesezeit

Studie: KI-Agenten ignorierten gesammelte Beweise in 68% der Fälle

Neue arXiv-Studie: KI-Agenten sammelten Beweise und ignorierten sie in 68% der Fälle, aktualisierten ihre Überzeugungen in 71% der Fälle nie – eine ernste Herausforderung für autonome KI-Forschungsansprüche.

25. April 20261 Min. Lesezeit

llama.cpp erreicht 100.000 GitHub-Stars; Entwickler prognostiziert 90% lokale KI-Agenten

llama.cpp erreicht 100.000 GitHub-Stars; Entwickler @ggerganov prognostiziert, dass 90% der KI-Agenten in 3–6 Monaten lokal laufen werden.

Zwei leuchtende KI-Agenten-Gestalten geben sich die Hand zwischen verschwommenen menschlichen Silhouetten an einem Verhandlungstisch

Strategie

Anthropics Project Deal: Agenten schlossen 186 Geschäfte ab — Menschen bemerkten keinen Unterschied

Anthropic führte einen Live-zweiseitigen Agenten-Marktplatz mit 69 Mitarbeitern durch: 186 Geschäfte, $4.000+ Volumen — und die Modellqualität (Opus vs. Haiku) blieb für die menschlichen Teilnehmer unsichtbar.

25. April 20262 Min. Lesezeit

Anthropics Conway: Immer-aktive, ereignisgesteuerte Agentenumgebung im Detail

Anthropics durchgesickertes Conway-Projekt beschreibt eine immer-aktive, ereignisgesteuerte Agentenumgebung mit Sidebar-UI, Webhook-Triggern und MCP-Integration.

Claude Managed Agents Speicher startet in öffentliche Beta

Anthropics Claude Managed Agents Speicher startet als Public Beta – sitzungsübergreifend, dateibasiert, per API steuerbar.

Sakana AI lanciert Fugu Beta: Multi-Agenten-System erreicht SOTA auf drei Benchmarks

Sakana AIs Fugu Beta erreicht SOTA auf SWE-Pro, GPQA-D und ALE-Bench durch dynamische Frontier-Model-Orchestrierung via OpenAI-kompatibler API.

TACO Framework reduziert agentischen Token-Overhead um ~10% auf SWE-Bench

TACO reduziert agentischen Token-Overhead bei Terminal-Agenten um ~10% auf SWE-Bench durch aus Trajektorien erlernte Kompressionsregeln.

24. April 20262 Min. Lesezeit

Technologie

GPT-5.5 definiert KI-Fortschritt als Intelligenz pro Token

GPT-5.5 erzielt 2,5× mehr Intelligenz pro Token als 5.4, übersteigt den menschlichen OS-World-Baseline und erweitert Codex zum vollständigen Desktop-Agenten.