Neueste Nachrichten

vor 1TGitHub Nexts ACE: Alignment löst Implementierung als Engpass ab vor 1TDeepSeek-V4 und Kimi-K2.6 verschieben die Open-Weights-Basis für KI-Agenten vor 1TGPT-5.5 in Codex: Begeisterung, Warnung und Toolchain-Integration vor 1TKimi K2.6 wird Open-Source-Nummer-1 mit 300-Agenten-Schwärmen vor 1TGoogle Deep Research Max: MCP-Anbindung und $4,80-Preismodell für Unternehmensrecherche vor 1TDeepSeek V4: Open Weights mit 1M-Token-Kontext ab Werk, zum Siebtel des Opus-4.7-Preises vor 1TGPT-5.5: Agentic-First-Modell, 82 % Terminal-Bench, Sicherheitsstufe HIGH vor 2TAnthropics Project Deal: Agenten schlossen 186 Geschäfte ab — Menschen bemerkten keinen Unterschied vor 2TGPT Image 2 gewinnt 93 % der Blindtests — Reasoning trifft die visuelle Ebene vor 2TMatt Pococks Gegenthese: Die Codebasis ist die Decke des Agenten vor 1TGitHub Nexts ACE: Alignment löst Implementierung als Engpass ab vor 1TDeepSeek-V4 und Kimi-K2.6 verschieben die Open-Weights-Basis für KI-Agenten vor 1TGPT-5.5 in Codex: Begeisterung, Warnung und Toolchain-Integration vor 1TKimi K2.6 wird Open-Source-Nummer-1 mit 300-Agenten-Schwärmen vor 1TGoogle Deep Research Max: MCP-Anbindung und $4,80-Preismodell für Unternehmensrecherche vor 1TDeepSeek V4: Open Weights mit 1M-Token-Kontext ab Werk, zum Siebtel des Opus-4.7-Preises vor 1TGPT-5.5: Agentic-First-Modell, 82 % Terminal-Bench, Sicherheitsstufe HIGH vor 2TAnthropics Project Deal: Agenten schlossen 186 Geschäfte ab — Menschen bemerkten keinen Unterschied vor 2TGPT Image 2 gewinnt 93 % der Blindtests — Reasoning trifft die visuelle Ebene vor 2TMatt Pococks Gegenthese: Die Codebasis ist die Decke des Agenten

Nachrichten

AI-News, Analysen & Einblicke aus kontinuierlichem AI-Branchenmonitoring.

Aktuelle News

BrancheErheblich· 5

GPT-5.5: Agentic-First-Modell, 82 % Terminal-Bench, Sicherheitsstufe HIGH

OpenAIs GPT-5.5 erscheint sechs Wochen nach 5.4 mit +7 Pkt. Terminal-Bench, verdoppelten Preisen und Cyber/Bio-Sicherheitseinstufungen auf HIGH.

26. April 20262 Min. Lesezeit

BrancheBedeutsam

DeepSeek V4: Open Weights mit 1M-Token-Kontext ab Werk, zum Siebtel des Opus-4.7-Preises

DeepSeek V4 veröffentlicht zwei Open-Weight-Modelle mit 1M-Token-Kontext ab Werk, CSA+HCA-Hybridattention und V4-Pro zum Siebtel des Opus-4.7-Ausgabepreises.

26. April 20262 Min. Lesezeit

TechnologieBedeutsam

GPT-5.5 in Codex: Begeisterung, Warnung und Toolchain-Integration

Drei unabhängige Quellen erfassten GPT-5.5 simultan: Begeisterung der Entwickler, Toolchain-Adoption und eine strukturelle Zuverlässigkeitswarnung.

27. April 20262 Min. Lesezeit

TechnologieBedeutsam

Google Deep Research Max: MCP-Anbindung und $4,80-Preismodell für Unternehmensrecherche

Google Deep Research Max kostet $4,80/Bericht und nutzt MCP für private Datenquellen. Unabhängige Tests zeigen: Das günstigere Modell gewinnt 5 von 7 Aufgaben.

26. April 20262 Min. Lesezeit

Live News Feed

Letzte Aktualisierung: vor 22 Std.

GesternApples CEO-Wechsel zu Hardware-Ingenieuren signalisiert On-Device-KI-Schwenk GesternAutogenesis-Protokoll bringt überprüfbare Selbstevolution zu Produktionsagenten GesternEhemaliger Tokyo-Electron-Ingenieur erhält 10 Jahre für TSMC-Datendiebstahl GesternDiversity-Collapse-Paper formalisiert Multi-Agenten-LLM-Homogenisierung GesternDS2API macht DeepSeek Web als OpenAI/Claude/Gemini-kompatible APIs zugänglich GesternGitHub Nexts ACE zeigt Multiplayer-Agenten-Kollaborationsumgebung GesternGoogle-DeepMind-Paper deutet auf post-Transformer-rekurrente Architektur hin GesternMemori erreicht 81,95% LoCoMo-Genauigkeit bei nur 4,97% der Full-Context-Token GesternZilliz memsearch vereinheitlicht Agenten-Gedächtnis für Claude Code, Codex und OpenClaw GesternMicrosofts internes 'Windows K2' soll KI-Überfrachtung in Win11 beheben

Alle Live-News anzeigen

Featured-Analyse

TechnologieReport

Intelligenz pro Token: Wie GPT-5.5, Codex und GPT Image 2 Reasoning vor alle Ausführungsebenen verlagerten

OpenAI und Anthropic verankerten Reasoning-Logik vor Pixel-, HTML- und OS-Primitiven – ein Sprung, der alle Ausführungsebenen gleichzeitig verschiebt.

25. April 202611 Min. Lesezeit

ToolsBemerkenswert

GitHub Nexts ACE: Alignment löst Implementierung als Engpass ab

GitHub Next demonstriert ACE: eine kollaborative Umgebung für Coding-Agents, in der Team-Alignment – nicht Implementierung – den entscheidenden Engpass bildet.

27. April 20262 Min. Lesezeit

TechnologieBemerkenswert

DeepSeek-V4 und Kimi-K2.6 verschieben die Open-Weights-Basis für KI-Agenten

DeepSeek-V4 (MIT, 1M-Kontext) und Kimi-K2.6 (multimodal, 256K-Kontext) bilden den ersten vollständigen Open-Weights-Stack für KI-Agenten.

27. April 20262 Min. Lesezeit

TechnologieBemerkenswert

Kimi K2.6 wird Open-Source-Nummer-1 mit 300-Agenten-Schwärmen

Moonshot AIs Kimi K2.6 führt das Open-Source-Ranking mit 300 parallelen Sub-Agenten und einem 12-Stunden-Coding-Marathon an.

26. April 20262 Min. Lesezeit

Strategiereport

DeepSeek V4: Der Open-Source-Effizienzschock und seine Bedeutung für die US-KI-Ökonomie

DeepSeeks 10-fache KV-Cache-Kompression verändert die KI-Kostenökonomie global und stellt US-Labs vor eine ernste strategische Herausforderung.

25. April 202613 Min. Lesezeit

Strategie

Anthropics Project Deal: Agenten schlossen 186 Geschäfte ab — Menschen bemerkten keinen Unterschied

Anthropic führte einen Live-zweiseitigen Agenten-Marktplatz mit 69 Mitarbeitern durch: 186 Geschäfte, $4.000+ Volumen — und die Modellqualität (Opus vs. Haiku) blieb für die menschlichen Teilnehmer unsichtbar.

25. April 20262 Min. Lesezeit

Technologie

GPT Image 2 gewinnt 93 % der Blindtests — Reasoning trifft die visuelle Ebene

GPT Image 2 erzielt einen 26-Punkte-Vorsprung in Image-Arena-Blindtests — beispiellos für die Kategorie — durch einen Reasoning-Loop vor jedem Pixel-Render.

25. April 20262 Min. Lesezeit

Tools

Matt Pococks Gegenthese: Die Codebasis ist die Decke des Agenten

Matt Pococks zweistündiger AI-Engineer-Workshop argumentiert, dass 30 Jahre alte Software-Grundlagen unter KI wichtiger sind, nicht weniger — und skizziert eine vollständige Methodik als Beweis.

25. April 20262 Min. Lesezeit

Forschung

Virginia-Tech-Preprint stellt Skill-MD-Paradigma mit modellnativen Skills infrage

Ein Virginia-Tech-Preprint zeigt, dass modellnative Skills via Sparse Autoencoders menschlich definierte Skill-Dateien bei SFT übertreffen — und 41 % Verbesserung in Mathe durch aktivierungsraumbasierte Datenselektion erzielen.

25. April 20262 Min. Lesezeit

Tools

Claude Code Regression: Drei Harness-Probleme, ein öffentliches Post-Mortem

Anthropic veröffentlicht ein Post-Mortem zu drei Claude Code Harness-Änderungen (März–April), die die Qualität minderten und in v2.1.116+ behoben wurden.

24. April 20262 Min. Lesezeit

AI Intelligence Newsletter

Kuratierte AI-Einblicke — wir senden, wenn es sich lohnt.