LlamaIndex launcht ParseBench: Unternehmens-Dokument-OCR-Benchmark auf Kaggle

LlamaIndex hat ParseBench auf Kaggle veröffentlicht – einen Dokument-OCR-Benchmark, der 2.000 Unternehmensseiten und über 167.000 Testregeln in fünf Auswertungsdimensionen abdeckt. Die aktuelle Leaderboard-Spitze belegen Gemini 3 Flash, GPT-5.4 und Gemma 4 31B.

LlamaIndex veröffentlicht ParseBench: Enterprise-Dokument-OCR-Benchmark auf Kaggle

LlamaIndex hat ParseBench auf Kaggle veröffentlicht – beschrieben als „der umfassendste Dokument-OCR-Benchmark auf realen Unternehmensdokumenten, mit Fokus auf semantische Korrektheit für KI-Agenten". Der Benchmark umfasst 2.000 Unternehmensseiten und über 167.000 Testregeln, ausgewertet in fünf Dimensionen: Tabellen, Diagramme, inhaltliche Korrektheit, Formatierung und visuelles Grounding. Das aktuelle Leaderboard wird von Gemini 3 Flash, GPT-5.4 und Gemma 4 31B angeführt; insgesamt wurden 14 Parser bewertet, darunter GPT-5 Mini, Gemini 3, Textract und LlamaParse. Benchmark und Ergebnisse sind unter parsebench.ai zugänglich.

Warum das relevant ist

Die Qualität des Dokument-Parsings ist ein kritischer und häufig unterschätzter Flaschenhals in Enterprise-RAG- und agentischen Workflows. ParseBench gibt Teams eine methodisch fundierte Grundlage, um Parser für reale Unternehmens-Dokumenttypen – Tabellen, Diagramme und komplexe Layouts – zu vergleichen und auszuwählen, statt auf synthetische Benchmarks angewiesen zu sein. Das Kaggle-Hosting öffnet die Teilnahme zudem für die breitere ML-Community bei zukünftigen Einreichungen.