Eleven Labs veröffentlicht Music V2 und Dubbing V2 mit Stimmerhaltung
Eleven Labs' Music V2 bietet kommerziell lizenzierte KI-Musikgenerierung; Dubbing V2 erhält Stimme, Emotion und Ausdruck bei Übersetzungs-Dubs.
Eleven Labs' Music V2 bietet kommerziell lizenzierte KI-Musikgenerierung; Dubbing V2 erhält Stimme, Emotion und Ausdruck bei Übersetzungs-Dubs.
Mistral Vibe wird als vollständige agentische Coding-Suite veröffentlicht — Work-Modus, Code-Modus, CLI und VS-Code-Erweiterung — für langfristige autonome Programmieraufgaben.
xAI veröffentlicht Grok Build für SuperGrok-Abonnenten — Terminal-Coding-Agent mit Plan-Modus, parallelen Subagenten und nativer CLAUDE.md-Unterstützung für CI-Pipelines.
Together AIs AI Native Cloud deployt ab sofort jedes Hugging-Face-Modell in einer einzigen Sitzung und eliminiert die bisher nötige mehrtägige Einrichtungszeit.
Mirage von Strukto: vereinheitlichtes virtuelles Dateisystem verbindet S3, GitHub, Gmail, Notion und weitere mit Unix-Semantik für KI-Agenten.
LlamaIndex startet LlamaParse Mobile – eine iOS/Android-App, die Dokumente per Kamerafoto in sauberen, kopierbaren Text unter einer Minute verwandelt.
LangChains DeepAgents Harness Profiles liefern 10–20 Punkte tau2-bench-Verbesserung durch modellspezifische System-Prompt- und Middleware-Overrides.
deepagents liefert ACP nativ: Jedes Interface (CLI, TUI, GUI, IDE) steuert denselben Agenten-Harness ohne Vendor-Lock-in. toad-TUI und JetBrains-IDE-Integration ab Tag eins verfügbar.
DS2API macht DeepSeek Web als OpenAI/Claude/Gemini-kompatible APIs zugänglich – reverse-engineered, mit Haftungsausschluss, aber ein klares Signal der Nachfrage.
GitHub Nexts ACE geht in technische Vorschau: Slack-artiges Multiplayer-Coding, microVM-basierte Sessions, geteilte Terminals und kollaborative Plandokumente.
Memori erreicht 81,95% LoCoMo-Genauigkeit bei nur 1.294 Token/Anfrage – 67% kleinere Prompts als Zep, 20-fach günstiger als Full-Context.
memsearch von Zilliz: ein Speicher-Backend für Claude Code, Codex, OpenClaw und OpenCode – Markdown als Quelle, lokale ONNX-Embeddings, hybride Suche.
DeepAgents-Middleware gewinnt mit vollständigen Standardeinstellungen und Hook-basierter Anpassung an Bedeutung – bereits in der Fertigung im Produktiveinsatz.
LangSmith Fleet liefert Dateibearbeitung (Bilder, PDFs, Text) und einen Präsentationsrenderer – Agenten erstellen Folien, die live in der App rendern.
Anthropic's Claude Cowork unterstützt jetzt interaktive Diagramme in der Beta auf allen bezahlten Plänen.
LlamaIndex veröffentlicht LiteParse – einen VLM-freien, ML-freien PDF-Parser per Rasterprojektions-Algorithmus für komplexe Layouts und Tabellen.
Kuratierte AI-Einblicke — wir senden, wenn es sich lohnt.