GEO

AI如何实现永久记忆?Supermemory ASMR系统99%准确率解析

2026/3/25
AI如何实现永久记忆?Supermemory ASMR系统99%准确率解析

AIAI Summary (BLUF)

Supermemory的ASMR系统以多智能体并行推理管道替代传统向量数据库,在LongMemEval基准测试中实现99%准确率,使AI具备跨对话的持久记忆能力。

引言:AI 记忆难题迎来突破性进展

AI 终于拥有了“永久记忆”!今天,超级记忆系统 ASMR 重磅登场,在业界公认最难的 AI 记忆基准测试中,取得了 99% 的准确率,刷新了 SOTA 记录。全网直呼太疯狂了。

AI 的记忆能力,尤其是长期、连贯且能处理时序与矛盾信息的记忆,一直是其迈向更高级智能体的核心障碍。传统的检索增强生成(RAG)方法在处理复杂、动态的对话历史时常常力不从心。然而,这一局面可能已被彻底改变。

The memory capability of AI, especially long-term, coherent memory that can handle temporal and contradictory information, has been a core obstacle in its evolution towards more advanced agents. Traditional Retrieval-Augmented Generation (RAG) methods often struggle with complex, dynamic conversation histories. However, this situation may have fundamentally changed.

核心突破:ASMR 系统与 LongMemEval 基准测试

什么是 ASMR?

ASMR(智能体搜索与记忆检索)是由 Supermemory 团队开发的一种新型记忆系统。它摒弃了传统的向量数据库和基于嵌入的检索方式,完全在内存中运行,通过多智能体并行推理流水线实现。

攻克最严苛的测试:LongMemEval

LongMemEval 是目前公开可见的最严苛的长期记忆基准测试之一。它模拟了真实的生产环境,包含超过 11.5 万个 Token 的对话历史、相互矛盾的信息、跨越多个会话的零散事件,以及需要进行时间推理的复杂问题。

ASMR 正是在这一极具挑战性的测试中取得了接近完美的 99% 准确率,标志着 AI 在“健忘症”问题上取得了里程碑式的进展。

It was on this highly challenging benchmark that ASMR achieved a near-perfect 99% accuracy, marking a milestone in AI's battle against "amnesia."

技术架构:多智能体协同的革新设计

ASMR 的核心创新在于其“多智能体协同编排”架构,它用主动的智能体推理完全取代了传统的向量相似度计算。

The core innovation of ASMR lies in its "multi-agent collaborative orchestration" architecture, which completely replaces traditional vector similarity calculations with proactive agent reasoning.

第一阶段:并行信息摄取

  • Preferences / 偏好
  • Events / 事件
  • Temporal Data / 时序数据

首先,由 3 个并行的观察者智能体(由 Gemini 2.0 Flash 等模型驱动)组成的团队并发读取原始对话数据。它们的目标是从六个维度提取结构化知识:

  • 个人信息
  • 偏好
  • 事件
  • 时序数据
  • 信息更新
  • 助手信息

这些结构化的发现被原生存储并映射回源会话,为高效检索奠定基础。

These structured findings are natively stored and mapped back to their source sessions, laying the foundation for efficient retrieval.

第二阶段:主动推理检索

当接收到查询时,ASMR 不会查询向量数据库,而是部署 3 个并行的搜索智能体。每个智能体都有专属的侧重点:

  • 智能体 1:搜索直接事实和明确陈述。
  • 智能体 2:寻找相关的上下文、社交线索和暗示。
  • 智能体 3:重建时间线和关系图谱。

编排器汇总所有搜索结果,并提取原文片段进行验证,实现了基于认知理解的智能检索。

The orchestrator aggregates all search results and extracts verbatim text fragments for verification, enabling intelligent retrieval based on cognitive understanding.

第三阶段:专业化答案生成

为了处理 LongMemEval 中多样化的问题,团队测试了两种高效的答案生成工作流:

To handle the diverse questions in LongMemEval, the team tested two efficient answer generation workflows:

1. 8 变体集群(98.6% 准确率):检索到的上下文被路由给 8 个高度专业化的提示词变体(例如,精准计数器、时间专家)并行运行。如果任何一个变体得出正确答案,该问题即被标记为正确。

2. 12 变体决策森林(97.2% 准确率):12 个专业化的 AI 智能体(由 GPT-4o-mini 驱动)独立回答问题。一个最终的聚合大模型充当裁判,通过多数投票和冲突解决机制综合答案,产生单一的共识答案。

超越实验:Supermemory 的宏大愿景

ASMR 不仅仅是一个刷榜的实验系统,它背后是 Supermemory 团队打造的一个完整的记忆与上下文基础设施。

ASMR is not just an experimental system for topping leaderboards. Behind it lies a complete memory and context infrastructure built by the Supermemory team.

记忆 vs. RAG:本质区别

Supermemory 的目标是赋予 AI 真正的记忆,而不仅仅是检索能力。关键区别在于,RAG 不区分用户且是静态的,而 Supermemory 会主动提取事实、追踪变化、处理矛盾,甚至实现临时信息的自动遗忘。

核心产品能力

统一的记忆与 RAG API:在一次 API 调用中(约 50 毫秒延迟)合并知识库检索和个性化上下文。

自动化用户画像:自动构建和维护用户画像(静态事实和动态上下文),使 AI 智能体能够切换到“老朋友模式”。

广泛的连接能力:支持通过 Webhook 与 Google Drive、Notion、GitHub 等外部数据源自动同步,并内置了对多种文件类型的处理能力。

开发者友好集成:为流行框架(Vercel AI SDK、LangChain 等)提供 SDK,并提供 MCP 服务器以便轻松集成到 Cursor 和 VS Code 等 IDE 中。

结论:记忆——AI 进化的下一块拼图

AI 的竞争长期以来集中在模型规模、推理速度和上下文长度上。然而,仅有一个大的上下文窗口并不等同于记忆。真正的记忆是将 AI 从“工具”转变为“伙伴”的最后一块拼图。当每个智能体都能记住你是谁、你之前在做什么时,人机交互将经历一场静默而深刻的变革。

Supermemory 团队通过 ASMR 系统及其产品化实践,正致力于将“工作记忆”从 AI 的附加功能提升为一层核心基础设施。随着其宣布将于 4 月初开源 ASMR 全部代码,AI 记忆的“大航海时代”或许真的即将开启。

By developing the ASMR system and its productized practices, the Supermemory team is working to elevate "working memory" from an add-on feature of AI to a core infrastructure layer. With the announcement that ASMR's full code will be open-sourced in early April, the "Age of Exploration" for AI memory may truly be about to begin.


本文基于公开报道及 Supermemory 团队发布的信息进行分析。所有图片来源均为原报道。

常见问题(FAQ)

Supermemory的ASMR系统与传统RAG方法有什么根本区别?

ASMR系统摒弃了传统的向量数据库和基于嵌入的检索,采用多智能体并行推理管道在内存中运行,通过主动的智能体推理取代向量相似度计算,从而实现了基于认知理解的智能检索。

ASMR系统在LongMemEval基准测试中表现如何?为什么这个测试很重要?

ASMR在LongMemEval基准测试中取得了99%的准确率。该测试模拟真实生产环境,包含超过11.5万Token的对话历史、矛盾信息和需要时间推理的复杂问题,是业界公认最严苛的AI长期记忆测试。

ASMR系统的多智能体架构是如何工作的?

系统分为三个阶段:1)并行信息摄取:3个观察者智能体从六个维度提取结构化知识;2)主动推理检索:3个搜索智能体分别专注于事实、上下文和时间线;3)专业化答案生成:通过智能体协作生成准确回答。

Roger深圳
本文由 Roger 审核,最后更新于 2026年7月2日
联系编辑 →
← 返回文章列表
分享到:微博

版权与免责声明:本文仅用于信息分享与交流,不构成任何形式的法律、投资、医疗或其他专业建议,也不构成对任何结果的承诺或保证。

文中提及的商标、品牌、Logo、产品名称及相关图片/素材,其权利归各自合法权利人所有。本站内容可能基于公开资料整理,亦可能使用 AI 辅助生成或润色;我们尽力确保准确与合规,但不保证完整性、时效性与适用性,请读者自行甄别并以官方信息为准。

若本文内容或素材涉嫌侵权、隐私不当或存在错误,请相关权利人/当事人联系本站,我们将及时核实并采取删除、修正或下架等处理措施。也请勿在评论或联系信息中提交身份证号、手机号、住址等个人敏感信息。