HuggingFace veröffentlicht ml-intern: Autonomer KI-Forschungs- und Trainings-Agent
HuggingFace hat ml-intern als öffentliche CLI und Web-App gestartet – einen autonomen KI-Forschungsagenten, der selbstständig wissenschaftliche Arbeiten recherchiert, Zitationsgraphen traversiert, Ideen in GPU-Sandboxes implementiert und Trainingsläufe iteriert. Das erste Ergebnis des Agenten, nanowhale (100-Millionen-Parameter-MoE), verbesserte einen Benchmark für wissenschaftliches Schlussfolgern von 10 % auf 32 % in unter 10 Stunden und übertraf Codex auf HealthBench um 60 % mithilfe synthetisch generierter medizinischer Trainingsdaten. Erste Nutzer erhalten 1.000 US-Dollar an GPU-Ressourcen zuzüglich Anthropic-Credits.
Einordnung
ml-interns GPQA-Score (32 %) übertrifft die Benchmark-Leistung von Claude Code (22,99 %) bei derselben Aufgabe – ein konkreter Meilenstein, bei dem autonome KI-Forschungsagenten menschengeführte Coding-Assistenten beim strukturierten wissenschaftlichen Schlussfolgern übertreffen.