Hugging Face Hub überschreitet eine Million öffentliche Datensätze

Hugging Face Hub hat eine Million öffentliche Datensätze erreicht — ein Meilenstein, der am 12. Mai 2026 bekanntgegeben wurde. Die zweiten 500K sammelten sich in lediglich 8 Monaten an, verglichen mit 4 Jahren für die ersten 500K, was eine 6-fache Beschleunigung der Datensatzerstellungs- und -teilungsrate darstellt. HF-CEO Clément Delangue führt die Beschleunigung explizit darauf zurück, dass KI-Agenten leistungsfähig genug geworden sind, um Datensätze im großen Maßstab zu erstellen und zu teilen. Die Plattform meldet täglich von Millionen KI-Entwicklern genutzte Petabytes an Daten; der nächste identifizierte Engpass ist bessere Daten für das Training selbst gehosteter Modelle — nicht der API-Zugang.

Einordnung

Die 6-fache Beschleunigung der Datensatz-Erstellungsgeschwindigkeit, die direkt auf agentische Werkzeuge zurückgeführt wird, ist ein frühes konkretes Signal dafür, dass sich das KI-Datenschwungrad schließt — wo Agenten Trainingsdaten generieren, die bessere Agenten trainieren.