Forschungbreaking
TALOS-V2: Vollständiger Transformer im FPGA mit 53.000 tok/Sek. ohne GPU
TALOS-V2 implementiert einen vollständigen Transformer in FPGA-Hardware und erreicht 53.000 tok/Sek. bei Batteriebetrieb – Embeddings, Attention, MLP und Sampling in Silizium.
5. Mai 20261 Min. Lesezeit