Intel veröffentlicht INT4-Quantisierungen von DeepSeek-V4 Pro und Flash via AutoRound — kein MXFP4 erforderlich
Intel hat W4A16-INT4-Quantisierungen sowohl von DeepSeek-V4-Pro als auch von DeepSeek-V4-Flash über sein AutoRound-Tool veröffentlicht; die Gewichte sind auf HuggingFace verfügbar. Entscheidend ist: Die Quantisierungen sind ohne MXFP4-Hardware-Unterstützung ausführbar — dem spezialisierten Format, das bislang einen Engpass für die breite Hardware-Deployment darstellte. Dies macht hochqualitative DeepSeek-V4-Inferenz auf einer breiteren Palette von Server- und Workstation-Hardware zugänglich, ohne Next-Generation-GPU-Fähigkeiten vorauszusetzen.
Warum das relevant ist
In Verbindung mit dem ebenfalls in diesem Zyklus gemeldeten 2-Bit-GGUF-Lokale-Inferenz-Meilenstein unterstreicht Intels INT4-Veröffentlichung, dass die DeepSeek-V4-Familie zum De-facto-Benchmark für zugängliche Frontier-Qualitäts-Open-Weight-Inferenz avanciert — wobei Intel, die breitere Open-Source-Community und Hardware-Anbieter gemeinsam die Rechenzentrums-Exklusivität aushöhlen.