
NVIDIA Nemotron 3 Ultra: Vollständig offenes 550B-MoE-Modell für Agentenworkflows
NVIDIA veröffentlicht Nemotron 3 Ultra — ein vollständig offenes 550B-MoE-Modell mit 5-fach schnellerer Inferenz und Day-0-Unterstützung durch LangChain.

NVIDIA veröffentlicht Nemotron 3 Ultra — ein vollständig offenes 550B-MoE-Modell mit 5-fach schnellerer Inferenz und Day-0-Unterstützung durch LangChain.

Anthropic veröffentlicht Claude Opus 4.8 mit dynamischen Workflows: Hunderte parallele Subagenten, adversarielle Prüfung und verbesserter Kalibrierung.
Gartner: 40 %+ agentischer KI-Projekte scheitern bis Ende 2027 — Kosten, unklarer Nutzen und fehlende Risikokontrolle als Hauptursachen laut Prognose.
Google DeepMinds KI-Mathematiker erzielt 48 % auf FrontierMath Tier 4 – neuer Rekord – und löste offene Forschungsprobleme in mehrstufigen Echtzeit-Sitzungen.

Ein 32.000-GPU-Stunden-Benchmark bestätigt: Die Harness-Architektur überwiegt die Modellauswahl — sechs unabhängige Quellen konvergieren auf denselben Befund.
Claude Code von Anthropic erhält Agent View: ein Multi-Session-Dashboard für parallele Agenten mit Statusanzeige und Hintergrundausführung.
Experian: 40 % der 5.000 Datenpannen 2025 waren KI-gestützt; Agentic AI wird als die größte Bedrohung für 2026 vorhergesagt.

Ein autonomer Agent für $20 legte McKinseys Lily-Plattform offen. Experian-Daten bestätigen: Agentische KI ist der führende Bedrohungsvektor des Jahres 2026.
Cloudflare streicht ein Fünftel der Belegschaft wegen agentischem KI-Umbau — erster großer Infrastrukturanbieter dieser Art.
Anthropics 'Code with Claude' ist eine kostenlose Livestream-Entwicklerkonferenz mit Demos, Workshops und Ingenieur-Talks zu Claude Code in Produktionsworkflows.
Metas LeCun: Agentische Systeme auf LLMs sind ein 'Rezept für eine Katastrophe' — eine markante Kursänderung eines der einflussreichsten KI-Forscher.

Ein wissenschaftlicher AlphaZero-Benchmark und ein globaler Hackathon bestätigen übereinstimmend Claude Opus 4.7 als aktuellen Frontier in agentic Coding.
Nvidias Nemotron 3 Nano Omni ist ein offenes multimodales 30B-A3B-MoE-Modell für agentische KI mit Vision- und Sprachfähigkeiten.
Ein neues Paper auf HuggingFace behandelt Agentic World Modeling: Grundlagen, Fähigkeitsanforderungen und Regulierungsprinzipien für KI-Agenten in offenen Umgebungen.
Autogenesis ermöglicht Agenten überprüfbare Selbstmodifikation: Fähigkeitslücken erkennen, Verbesserungen generieren und testen, mit vollständigem Verlauf und Rollback integrieren.
Forschung formalisiert 'Diversity Collapse': Multi-Agenten-LLM-Systeme homogenisieren Ausgaben durch strukturelle Kopplung – Brainstorming-Setups müssen explizit für Heterogenität entwickelt werden.

DeepSeek-V4 (MIT, 1M-Kontext) und Kimi-K2.6 (multimodal, 256K-Kontext) bilden den ersten vollständigen Open-Weights-Stack für KI-Agenten.

Moonshot AIs Kimi K2.6 führt das Open-Source-Ranking mit 300 parallelen Sub-Agenten und einem 12-Stunden-Coding-Marathon an.

OpenAIs GPT-5.5 erscheint sechs Wochen nach 5.4 mit +7 Pkt. Terminal-Bench, verdoppelten Preisen und Cyber/Bio-Sicherheitseinstufungen auf HIGH.
Bloomberg porträtiert Strider, das agentenbasierte KI und öffentliche Daten nutzt, um ausländische Staatsakteure für US Air Force und NATO zu identifizieren.
Neue arXiv-Studie: KI-Agenten sammelten Beweise und ignorierten sie in 68% der Fälle, aktualisierten ihre Überzeugungen in 71% der Fälle nie – eine ernste Herausforderung für autonome KI-Forschungsansprüche.
llama.cpp erreicht 100.000 GitHub-Stars; Entwickler @ggerganov prognostiziert, dass 90% der KI-Agenten in 3–6 Monaten lokal laufen werden.

Anthropic führte einen Live-zweiseitigen Agenten-Marktplatz mit 69 Mitarbeitern durch: 186 Geschäfte, $4.000+ Volumen — und die Modellqualität (Opus vs. Haiku) blieb für die menschlichen Teilnehmer unsichtbar.
Anthropics durchgesickertes Conway-Projekt beschreibt eine immer-aktive, ereignisgesteuerte Agentenumgebung mit Sidebar-UI, Webhook-Triggern und MCP-Integration.
Anthropics Claude Managed Agents Speicher startet als Public Beta – sitzungsübergreifend, dateibasiert, per API steuerbar.
Sakana AIs Fugu Beta erreicht SOTA auf SWE-Pro, GPQA-D und ALE-Bench durch dynamische Frontier-Model-Orchestrierung via OpenAI-kompatibler API.
TACO reduziert agentischen Token-Overhead bei Terminal-Agenten um ~10% auf SWE-Bench durch aus Trajektorien erlernte Kompressionsregeln.

GPT-5.5 erzielt 2,5× mehr Intelligenz pro Token als 5.4, übersteigt den menschlichen OS-World-Baseline und erweitert Codex zum vollständigen Desktop-Agenten.
GPT-Image-2-Thinking ist kein Generierungsmodell, sondern ein Bild-Agent-Loop mit Suche und Compositing-Tools für präzise Einmal-Ausgaben.
Anthropics Compute-Engpass führt zu einer Eskalation: Claude Code aus Pro entfernt (A/B-Test), OpenClaw gesperrt, Opus 4.7-Tokenizer verbraucht bis zu 35% mehr Tokens.
ml-intern liest arXiv, bereinigt Datensätze, führt SFT/GRPO durch und iteriert — GPQA stieg in unter 10 Stunden von 10% auf 32% für etwa 1 Dollar Rechenkosten.
OpenAI startet ChatGPT Workspace Agents für bezahlte Pläne — gemeinsam nutzbare Agenten für automatisierte Hintergrundworkflows über Docs, E-Mail, Slack und Linear.
Kuratierte AI-Einblicke — wir senden, wenn es sich lohnt.