OpenAI veröffentlicht Privacy Filter — erstes Open-Weight-Modell des Jahres 2026

OpenAI veröffentlicht Privacy Filter — ein 1,5B-Parameter-MoE-Modell (50M aktiv) zur PII-Erkennung und -Maskierung unter Apache 2.0. Es unterstützt ein 128k-Kontextfenster, läuft On-Device und ist für die Filterung von Daten im Billionen-Token-Maßstab konzipiert.

OpenAI veröffentlicht Privacy Filter — erstes Open-Weight-Modell des Jahres 2026

OpenAI hat Privacy Filter auf HuggingFace unter Apache 2.0 veröffentlicht — ein bidirektionales Token-Klassifizierungsmodell, das auf der GPT-OSS-Architektur basiert (MoE: 1,5B Gesamt- / 50M aktive Parameter). Das Modell erkennt und maskiert personenbezogene Daten (PII) in Texten im großen Maßstab, unterstützt ein 128k-Kontextfenster, kann On-Device im Browser ausgeführt werden und ist für die Filterung von Datenpipelines im Billionen-Token-Bereich bei minimalem Inference-Aufwand konzipiert. Dies markiert OpenAIs erste Open-Weight-Modellveröffentlichung des Jahres 2026.

Warum das wichtig ist

Privacy Filter signalisiert einen bedeutsamen Kurswechsel: OpenAI stellt ein praktisches, Apache-lizenziertes Hilfsmodell für die Datenverarbeitungsinfrastruktur bereit. Für Teams, die Datenpipelines oder RAG-Systeme mit sensiblen Eingaben aufbauen, ist ein PII-Masker mit 50M aktiven Parametern von OpenAI ohne Lizenzkosten sofort einsatzbereit. Die vollständige Modellkarte ist auf HuggingFace verfügbar.