NVIDIA veröffentlicht Nemotron 3 Ultra: 550-Milliarden-Parameter Open-Source-Modell
NVIDIA hat Nemotron 3 Ultra als Open-Source-Modell freigegeben — ein Mixture-of-Experts-Modell mit 550 Milliarden Parametern (55 Milliarden aktiv), das auf einem hybriden Mamba-2-Transformer mit einem 1-Millionen-Token-Kontextfenster aufbaut. Vortrainiert auf 20 Billionen Token in NVFP4, liefert es eine fünffach schnellere Inferenz und bis zu 30 % geringere Kosten gegenüber vergleichbaren offenen Frontier-Modellen. Vollständige Gewichte, Trainingsrezepte, Basis/Post-Training/Reward-Checkpoints sowie eine NVFP4-quantisierte Version sind auf Hugging Face unter der OpenMDW-1.1-Open-Model-Lizenz verfügbar.
Bedeutung
Nemotron 3 Ultra ist das leistungsstärkste vollständig offene Modell, das bislang veröffentlicht wurde. Mit Day-0-Unterstützung durch LangChain, HuggingFace Transformers und der Nemotron Coalition verändert es direkt die Kostenstruktur groß angelegter agentischer Deployments — zu einem Bruchteil der Preise geschlossener Frontier-Modelle.