OpenAI veröffentlicht Privacy Filter — erstes Open-Weight-Modell des Jahres 2026
OpenAI hat Privacy Filter auf HuggingFace unter Apache 2.0 veröffentlicht — ein bidirektionales Token-Klassifizierungsmodell, das auf der GPT-OSS-Architektur basiert (MoE: 1,5B Gesamt- / 50M aktive Parameter). Das Modell erkennt und maskiert personenbezogene Daten (PII) in Texten im großen Maßstab, unterstützt ein 128k-Kontextfenster, kann On-Device im Browser ausgeführt werden und ist für die Filterung von Datenpipelines im Billionen-Token-Bereich bei minimalem Inference-Aufwand konzipiert. Dies markiert OpenAIs erste Open-Weight-Modellveröffentlichung des Jahres 2026.
Warum das wichtig ist
Privacy Filter signalisiert einen bedeutsamen Kurswechsel: OpenAI stellt ein praktisches, Apache-lizenziertes Hilfsmodell für die Datenverarbeitungsinfrastruktur bereit. Für Teams, die Datenpipelines oder RAG-Systeme mit sensiblen Eingaben aufbauen, ist ein PII-Masker mit 50M aktiven Parametern von OpenAI ohne Lizenzkosten sofort einsatzbereit. Die vollständige Modellkarte ist auf HuggingFace verfügbar.