7 Artikel

#on-device-ai

NVIDIA RTX Spark: 128 GB Unified Memory für lokale KI-Modelle

NVIDIAs RTX Spark bringt ~1 PFLOP FP4 und bis zu 128 GB Unified Memory in Laptops und Desktops — genug für Frontier-Open-Modelle auf dem eigenen Gerät. Erscheint Herbst 2026.

7. Juni 20261 Min. Lesezeit

Toolsbreaking

Google Magenta RealTime 2: 200 ms On-Device-Musikgenerierung

Google Magenta RealTime 2: Open-Weights-Echtzeitmusik bei ~200 ms Latenz, steuerbar per Text/Audio/MIDI, 2,4 Mrd. Parameter — läuft ohne GPU auf einem MacBook.

7. Juni 20261 Min. Lesezeit

Technologiebreaking

Google veröffentlicht Gemma 4 12B: Encoder-freies multimodales Modell

Googles Gemma 4 12B ist encoder-frei und multimodal — Text, Audio, Video, Bild — in 16 GB VRAM unter Apache 2.0. Sofort in Transformers, llama.cpp und MLX nutzbar.

7. Juni 20261 Min. Lesezeit

Technologiebreaking

Apple präsentiert On-Device-KI auf der WWDC mit destilliertem Gemini-Modell

Apple will auf der WWDC 2026 On-Device-KI mit eigenem Chip und einem destillierten Gemini-Modell präsentieren und lokale Inferenz als Wettbewerbsvorteil gegenüber Cloud-abhängigen Mitbewerbern positionieren.

30. Mai 20261 Min. Lesezeit

Technologiebreaking

Google liefert Chrome-KI-API trotz W3C- und Mozilla-Widerstand aus

Google hat die Chrome-On-Device-Prompt-API trotz Widerspruchs von W3C, Mozilla, WebKit und Microsoft ausgeliefert — jede Website darf nun Gemini Nano befragen.

9. Mai 20261 Min. Lesezeit

Edwardisches Physiklabor mit überlagertem Neural-Network-Leuchten, das vorrelativistische Wissenschaft und moderne KI verbindet

ForschungBemerkenswert

Talkie-LM: Das 13B-Modell aus der Zeit vor 1931

Ein 13B-Modell, das nur auf Texten vor 1931 trainiert wurde, verteidigt den Lichtäther — eine Studie zur LLM-Generalisierung.

28. April 20262 Min. Lesezeit

Strategiebreaking

Apples CEO-Wechsel zu Hardware-Ingenieuren signalisiert On-Device-KI-Schwenk

Apple setzt zwei Silicon-Ingenieure an die Spitze – ein strategischer Schwenk von Cloud-KI-Geschwindigkeit zu On-Device-Inferenz.

27. April 20261 Min. Lesezeit

AI Intelligence Newsletter

Kuratierte AI-Einblicke — wir senden, wenn es sich lohnt.