5 Artikel

#rag

Memori erreicht 81,95% LoCoMo-Genauigkeit bei nur 4,97% der Full-Context-Token

Memori erreicht 81,95% LoCoMo-Genauigkeit bei nur 1.294 Token/Anfrage – 67% kleinere Prompts als Zep, 20-fach günstiger als Full-Context.

27. April 20261 Min. Lesezeit

Forschungbreaking

Skill-RAG löst Retrieval nur aus, wenn das LLM kurz vor dem Scheitern steht

Skill-RAG erkennt LLM-Versagen via Hidden-State-Analyse, ruft nur bei Bedarf Wissen ab und routet Fehlertypen zu spezialisierten Skills.

27. April 20261 Min. Lesezeit

Technologiebreaking

OpenAI stellt text-embedding-3-small Embedding-Modell ein

OpenAI stellt text-embedding-3-small ein — Forderungen nach Open-Sourcing, damit Billionen indizierter Tokens nach dem Modell-Rückzug weiter abfragbar bleiben.

23. April 20261 Min. Lesezeit

Technologiereport

Context Engineering in der Produktion: Muster aus 50 Enterprise-Deployments

Eine Analyse der Context-Engineering-Muster aus 50 produktiven AI-Deployments — RAG-Architekturen, Knowledge-Graph-Integration, mehrschichtige Speichersysteme und der Wandel von Prompt Engineering zu strukturierten Kontext-Pipelines.

28. März 202622 Min. Lesezeit

Technologiereport

Knowledge Graphs treffen LLMs: Integrationsmuster fuer fundierte AI-Systeme

Wie fuehrende Organisationen Knowledge Graphs mit LLMs kombinieren, um AI-Systeme zu bauen, die ueber strukturierte Beziehungen schlussfolgern — GraphRAG-Architekturen, Entity Resolution und das aufkommende Graph-native Context Engineering.

1. März 202620 Min. Lesezeit

AI Intelligence Newsletter

Kuratierte AI-Einblicke — wir senden, wenn es sich lohnt.