
NVIDIA Nemotron 3 Ultra: Vollständig offenes 550B-MoE-Modell für Agentenworkflows
NVIDIA veröffentlicht Nemotron 3 Ultra — ein vollständig offenes 550B-MoE-Modell mit 5-fach schnellerer Inferenz und Day-0-Unterstützung durch LangChain.

NVIDIA veröffentlicht Nemotron 3 Ultra — ein vollständig offenes 550B-MoE-Modell mit 5-fach schnellerer Inferenz und Day-0-Unterstützung durch LangChain.
Hugging Face Hub erreicht 1 Million öffentliche Datensätze: die Verdopplung von 500K auf 1M dauerte 8 Monate statt 4 Jahre — CEO führt die Beschleunigung auf KI-Agenten zurück.
GGUF-Lokalmodelle auf Hugging Face erreichen 176.000; monatliche Erstellungsrate seit März verdoppelt – Lokalmodell-Adoption hat einen Wendepunkt überschritten.
Together AIs AI Native Cloud deployt ab sofort jedes Hugging-Face-Modell in einer einzigen Sitzung und eliminiert die bisher nötige mehrtägige Einrichtungszeit.
Reachy Mini erhält ein vollständig quelloffenes Voice-Agent-Backend auf Hugging-Face-Infrastruktur — über 3.000 Roboter verbunden in 48 Stunden, Kosten nahezu null.

Google DeepMind veröffentlicht Gemma 4 unter Apache 2.0: MoE-Architektur, On-Device-Multimodalität und Platz 3 auf dem globalen LM Arena Leaderboard.
Kuratierte AI-Einblicke — wir senden, wenn es sich lohnt.