NVIDIA RTX Spark: 128 GB Unified Memory für lokale KI-Modelle
NVIDIAs RTX Spark bringt ~1 PFLOP FP4 und bis zu 128 GB Unified Memory in Laptops und Desktops — genug für Frontier-Open-Modelle auf dem eigenen Gerät. Erscheint Herbst 2026.
NVIDIAs RTX Spark bringt ~1 PFLOP FP4 und bis zu 128 GB Unified Memory in Laptops und Desktops — genug für Frontier-Open-Modelle auf dem eigenen Gerät. Erscheint Herbst 2026.
Google Magenta RealTime 2: Open-Weights-Echtzeitmusik bei ~200 ms Latenz, steuerbar per Text/Audio/MIDI, 2,4 Mrd. Parameter — läuft ohne GPU auf einem MacBook.
Googles Gemma 4 12B ist encoder-frei und multimodal — Text, Audio, Video, Bild — in 16 GB VRAM unter Apache 2.0. Sofort in Transformers, llama.cpp und MLX nutzbar.
Apple will auf der WWDC 2026 On-Device-KI mit eigenem Chip und einem destillierten Gemini-Modell präsentieren und lokale Inferenz als Wettbewerbsvorteil gegenüber Cloud-abhängigen Mitbewerbern positionieren.
Google hat die Chrome-On-Device-Prompt-API trotz Widerspruchs von W3C, Mozilla, WebKit und Microsoft ausgeliefert — jede Website darf nun Gemini Nano befragen.

Ein 13B-Modell, das nur auf Texten vor 1931 trainiert wurde, verteidigt den Lichtäther — eine Studie zur LLM-Generalisierung.
Apple setzt zwei Silicon-Ingenieure an die Spitze – ein strategischer Schwenk von Cloud-KI-Geschwindigkeit zu On-Device-Inferenz.
Kuratierte AI-Einblicke — wir senden, wenn es sich lohnt.