Forschungbreaking
Meta präsentiert Tuna-2: Pixel-Embeddings vereinen visuelles Verstehen und Generierung
Metas Tuna-2 vereint multimodales Verstehen, Generierung und Bearbeitung aus rohen Pixel-Embeddings — ohne konventionelle Vision-Encoder.
29. April 20261 Min. Lesezeit