Prism ML Bonsai 4B: Ternäres Bildmodell läuft mit 3,7 GB

Prism ML hat Bonsai Image 4B veröffentlicht, ein binär/ternäres Nachtraining von Black Forest Labs' Flux 2 Klein 4B. Anders als Quantisierungsansätze, die die Qualität merklich einschränken, rekonstruiert Prism die Gewichte des Diffusions-Transformers nativ für die binäre/ternäre Darstellung. Die ternäre Variante benötigt während der Generierung maximal rund 3,7 GB — gegenüber ~13 GB für FP16 — und produziert auf einem MacBook in unter 5 Sekunden nutzbare Bilder bei etwa 95 % Qualität. Die Textdarstellung bleibt eine bekannte Schwachstelle.

Warum das wichtig ist

Ein hochwertiges Bildgenerierungsmodell, das mit unter 4 GB RAM auskommt, markiert die Schwelle, ab der lokale Bildgenerierung auf Consumer-Hardware ohne dedizierte GPU-Ausstattung praktikabel wird. Bonsai Image 4B läuft zudem auf iOS über Bonsai Studio — und bringt damit lokale multimodale Generierung auch auf Smartphones.