OpenAI veröffentlicht MRC-Netzwerkprotokoll für KI-Trainingscluster

OpenAI hat gemeinsam mit AMD, Broadcom, Intel, Microsoft und NVIDIA das Protokoll MRC — Multipath Reliable Connection — veröffentlicht: ein offenes Netzwerkprotokoll, das große KI-Trainingscluster schneller und zuverlässiger betreiben soll und dabei weniger GPU-Rechenzeit verschwendet. MRC ist bereits auf OpenAIs leistungsstärksten Supercomputern im Einsatz — darunter die Oracle Cloud Infrastructure in Abilene, Texas, und Microsofts Fairwater-Supercomputer. Ab sofort steht das Protokoll über das Open Compute Project der Branche zur allgemeinen Nutzung zur Verfügung.

Einordnung

Die Freigabe eines zentralen Trainingsinfrastruktur-Protokolls über das Open Compute Project ist ein seltener Schritt zur Branchenharmonisierung seitens OpenAI. Er signalisiert, dass Interconnect-Effizienz — nicht allein die Chip-Leistung — eine limitierende Größe im Compute-Wettbewerb ist, von der eine gemeinsame Standardisierung profitiert.