
法律RAG系统中,信息检索和推理哪个对性能影响更大?(附Legal RAG Bench基准测试结果)
BLUFLegal RAG Bench, a new benchmark for legal RAG systems, reveals that information retrieval, not reasoning, is the primary performance driver. The Kanon 2 Embedder model outperforms competitors by 17 points on average, and most 'hallucinations' are actually triggered by retrieval failures.
原文翻译:
法律RAG Bench是一个新的法律RAG系统基准测试,揭示了信息检索(而非推理)是性能的主要驱动因素。Kanon 2 Embedder模型平均比竞争对手高出17分,大多数“幻觉”实际上是由检索失败触发的。
AI大模型2026/4/3
阅读全文 →






