Intel veröffentlicht INT4-Quantisierungen von DeepSeek-V4 Pro und Flash – kein MXFP4 nötig

Intel veröffentlichte W4A16-INT4-Quantisierungen von DeepSeek-V4-Pro und DeepSeek-V4-Flash via AutoRound, die beide ohne MXFP4-Hardware-Unterstützung ausführbar machen und die zugänglichen Deployment-Optionen erheblich erweitern.

Intel veröffentlicht INT4-Quantisierungen von DeepSeek-V4 Pro und Flash via AutoRound — kein MXFP4 erforderlich

Intel hat W4A16-INT4-Quantisierungen sowohl von DeepSeek-V4-Pro als auch von DeepSeek-V4-Flash über sein AutoRound-Tool veröffentlicht; die Gewichte sind auf HuggingFace verfügbar. Entscheidend ist: Die Quantisierungen sind ohne MXFP4-Hardware-Unterstützung ausführbar — dem spezialisierten Format, das bislang einen Engpass für die breite Hardware-Deployment darstellte. Dies macht hochqualitative DeepSeek-V4-Inferenz auf einer breiteren Palette von Server- und Workstation-Hardware zugänglich, ohne Next-Generation-GPU-Fähigkeiten vorauszusetzen.

Warum das relevant ist

In Verbindung mit dem ebenfalls in diesem Zyklus gemeldeten 2-Bit-GGUF-Lokale-Inferenz-Meilenstein unterstreicht Intels INT4-Veröffentlichung, dass die DeepSeek-V4-Familie zum De-facto-Benchmark für zugängliche Frontier-Qualitäts-Open-Weight-Inferenz avanciert — wobei Intel, die breitere Open-Source-Community und Hardware-Anbieter gemeinsam die Rechenzentrums-Exklusivität aushöhlen.