HuggingFace veröffentlicht ml-intern: Autonomer KI-Forschungs- und Training-Agent

HuggingFace hat ml-intern als öffentliche CLI und Web-App gestartet – einen autonomen KI-Forschungs- und Trainings-Agenten, der selbstständig wissenschaftliche Arbeiten recherchiert, Ideen implementiert und Trainingsläufe ausführt. Gegenüber Codex auf HealthBench erreichte der Agent einen Vorsprung von 60 %.

1 Min. Lesezeit|agenticonsult Intelligence

HuggingFace veröffentlicht ml-intern: Autonomer KI-Forschungs- und Trainings-Agent

HuggingFace hat ml-intern als öffentliche CLI und Web-App gestartet – einen autonomen KI-Forschungsagenten, der selbstständig wissenschaftliche Arbeiten recherchiert, Zitationsgraphen traversiert, Ideen in GPU-Sandboxes implementiert und Trainingsläufe iteriert. Das erste Ergebnis des Agenten, nanowhale (100-Millionen-Parameter-MoE), verbesserte einen Benchmark für wissenschaftliches Schlussfolgern von 10 % auf 32 % in unter 10 Stunden und übertraf Codex auf HealthBench um 60 % mithilfe synthetisch generierter medizinischer Trainingsdaten. Erste Nutzer erhalten 1.000 US-Dollar an GPU-Ressourcen zuzüglich Anthropic-Credits.

Einordnung

ml-interns GPQA-Score (32 %) übertrifft die Benchmark-Leistung von Claude Code (22,99 %) bei derselben Aufgabe – ein konkreter Meilenstein, bei dem autonome KI-Forschungsagenten menschengeführte Coding-Assistenten beim strukturierten wissenschaftlichen Schlussfolgern übertreffen.

Diskutieren aufLinkedIn X

Diese Eilmeldung wurde mit AI-Unterstuetzung aus der genannten Primaerquelle zusammengestellt. Sie dient der schnellen Lageorientierung — fuer die massgebliche Aussage bitte die Originalpublikation konsultieren.

HuggingFace veröffentlicht ml-intern: Autonomer KI-Forschungs- und Training-Agent

HuggingFace veröffentlicht ml-intern: Autonomer KI-Forschungs- und Trainings-Agent

Einordnung

Live News Feed