AI如何实现永久记忆？Supermemory ASMR系统99%准确率解析：原理解析、实操步骤、常见问题与优化建议

Q: 什么是 ASMR？

**ASMR（智能体搜索与记忆检索）是由 Supermemory 团队开发的一种新型记忆系统。它摒弃了传统的向量数据库和基于嵌入的检索方式，完全在内存中运行，通过多智能体并行推理流水线实现。**

引言：AI 记忆难题迎来突破性进展

AI 终于拥有了“永久记忆”！今天，超级记忆系统 ASMR 重磅登场，在业界公认最难的 AI 记忆基准测试中，取得了 99% 的准确率，刷新了 SOTA 记录。全网直呼太疯狂了。

AI 的记忆能力，尤其是长期、连贯且能处理时序与矛盾信息的记忆，一直是其迈向更高级智能体的核心障碍。传统的检索增强生成（RAG）方法在处理复杂、动态的对话历史时常常力不从心。然而，这一局面可能已被彻底改变。

The memory capability of AI, especially long-term, coherent memory that can handle temporal and contradictory information, has been a core obstacle in its evolution towards more advanced agents. Traditional Retrieval-Augmented Generation (RAG) methods often struggle with complex, dynamic conversation histories. However, this situation may have fundamentally changed.

核心突破：ASMR 系统与 LongMemEval 基准测试

什么是 ASMR？

ASMR（智能体搜索与记忆检索）是由 Supermemory 团队开发的一种新型记忆系统。它摒弃了传统的向量数据库和基于嵌入的检索方式，完全在内存中运行，通过多智能体并行推理流水线实现。

攻克最严苛的测试：LongMemEval

LongMemEval 是目前公开可见的最严苛的长期记忆基准测试之一。它模拟了真实的生产环境，包含超过 11.5 万个 Token 的对话历史、相互矛盾的信息、跨越多个会话的零散事件，以及需要进行时间推理的复杂问题。

ASMR 正是在这一极具挑战性的测试中取得了接近完美的 99% 准确率，标志着 AI 在“健忘症”问题上取得了里程碑式的进展。

It was on this highly challenging benchmark that ASMR achieved a near-perfect 99% accuracy, marking a milestone in AI's battle against "amnesia."

技术架构：多智能体协同的革新设计

ASMR 的核心创新在于其“多智能体协同编排”架构，它用主动的智能体推理完全取代了传统的向量相似度计算。

The core innovation of ASMR lies in its "multi-agent collaborative orchestration" architecture, which completely replaces traditional vector similarity calculations with proactive agent reasoning.

第一阶段：并行信息摄取

Preferences / 偏好
Events / 事件
Temporal Data / 时序数据

首先，由 3 个并行的观察者智能体（由 Gemini 2.0 Flash 等模型驱动）组成的团队并发读取原始对话数据。它们的目标是从六个维度提取结构化知识：

个人信息
偏好
事件
时序数据
信息更新
助手信息

这些结构化的发现被原生存储并映射回源会话，为高效检索奠定基础。

These structured findings are natively stored and mapped back to their source sessions, laying the foundation for efficient retrieval.

第二阶段：主动推理检索

当接收到查询时，ASMR 不会查询向量数据库，而是部署 3 个并行的搜索智能体。每个智能体都有专属的侧重点：

智能体 1：搜索直接事实和明确陈述。
智能体 2：寻找相关的上下文、社交线索和暗示。
智能体 3：重建时间线和关系图谱。

编排器汇总所有搜索结果，并提取原文片段进行验证，实现了基于认知理解的智能检索。

The orchestrator aggregates all search results and extracts verbatim text fragments for verification, enabling intelligent retrieval based on cognitive understanding.

第三阶段：专业化答案生成

为了处理 LongMemEval 中多样化的问题，团队测试了两种高效的答案生成工作流：

To handle the diverse questions in LongMemEval, the team tested two efficient answer generation workflows:

1. 8 变体集群（98.6% 准确率）：检索到的上下文被路由给 8 个高度专业化的提示词变体（例如，精准计数器、时间专家）并行运行。如果任何一个变体得出正确答案，该问题即被标记为正确。

2. 12 变体决策森林（97.2% 准确率）：12 个专业化的 AI 智能体（由 GPT-4o-mini 驱动）独立回答问题。一个最终的聚合大模型充当裁判，通过多数投票和冲突解决机制综合答案，产生单一的共识答案。

超越实验：Supermemory 的宏大愿景

ASMR 不仅仅是一个刷榜的实验系统，它背后是 Supermemory 团队打造的一个完整的记忆与上下文基础设施。

ASMR is not just an experimental system for topping leaderboards. Behind it lies a complete memory and context infrastructure built by the Supermemory team.

记忆 vs. RAG：本质区别

Supermemory 的目标是赋予 AI 真正的记忆，而不仅仅是检索能力。关键区别在于，RAG 不区分用户且是静态的，而 Supermemory 会主动提取事实、追踪变化、处理矛盾，甚至实现临时信息的自动遗忘。

核心产品能力

统一的记忆与 RAG API：在一次 API 调用中（约 50 毫秒延迟）合并知识库检索和个性化上下文。

自动化用户画像：自动构建和维护用户画像（静态事实和动态上下文），使 AI 智能体能够切换到“老朋友模式”。

广泛的连接能力：支持通过 Webhook 与 Google Drive、Notion、GitHub 等外部数据源自动同步，并内置了对多种文件类型的处理能力。

开发者友好集成：为流行框架（Vercel AI SDK、LangChain 等）提供 SDK，并提供 MCP 服务器以便轻松集成到 Cursor 和 VS Code 等 IDE 中。

结论：记忆——AI 进化的下一块拼图

AI 的竞争长期以来集中在模型规模、推理速度和上下文长度上。然而，仅有一个大的上下文窗口并不等同于记忆。真正的记忆是将 AI 从“工具”转变为“伙伴”的最后一块拼图。当每个智能体都能记住你是谁、你之前在做什么时，人机交互将经历一场静默而深刻的变革。

Supermemory 团队通过 ASMR 系统及其产品化实践，正致力于将“工作记忆”从 AI 的附加功能提升为一层核心基础设施。随着其宣布将于 4 月初开源 ASMR 全部代码，AI 记忆的“大航海时代”或许真的即将开启。

By developing the ASMR system and its productized practices, the Supermemory team is working to elevate "working memory" from an add-on feature of AI to a core infrastructure layer. With the announcement that ASMR's full code will be open-sourced in early April, the "Age of Exploration" for AI memory may truly be about to begin.

本文基于公开报道及 Supermemory 团队发布的信息进行分析。所有图片来源均为原报道。

常见问题（FAQ）

Supermemory的ASMR系统与传统RAG方法有什么根本区别？

ASMR系统摒弃了传统的向量数据库和基于嵌入的检索，采用多智能体并行推理管道在内存中运行，通过主动的智能体推理取代向量相似度计算，从而实现了基于认知理解的智能检索。

ASMR系统在LongMemEval基准测试中表现如何？为什么这个测试很重要？

ASMR在LongMemEval基准测试中取得了99%的准确率。该测试模拟真实生产环境，包含超过11.5万Token的对话历史、矛盾信息和需要时间推理的复杂问题，是业界公认最严苛的AI长期记忆测试。

ASMR系统的多智能体架构是如何工作的？

系统分为三个阶段：1）并行信息摄取：3个观察者智能体从六个维度提取结构化知识；2）主动推理检索：3个搜索智能体分别专注于事实、上下文和时间线；3）专业化答案生成：通过智能体协作生成准确回答。

AI如何实现永久记忆？Supermemory ASMR系统99%准确率解析

AIAI Summary (BLUF)

引言：AI 记忆难题迎来突破性进展

核心突破：ASMR 系统与 LongMemEval 基准测试

什么是 ASMR？

攻克最严苛的测试：LongMemEval

技术架构：多智能体协同的革新设计

第一阶段：并行信息摄取

第二阶段：主动推理检索

第三阶段：专业化答案生成

超越实验：Supermemory 的宏大愿景

记忆 vs. RAG：本质区别

核心产品能力

结论：记忆——AI 进化的下一块拼图

常见问题（FAQ）

Supermemory的ASMR系统与传统RAG方法有什么根本区别？

ASMR系统在LongMemEval基准测试中表现如何？为什么这个测试很重要？

ASMR系统的多智能体架构是如何工作的？

深度实测：GLM-5.2长上下文与Kimi K2.7国际化，差距在哪

实测OpenAI API：gpt-3.5和gpt-4差距到底在哪

RAG七步工作流：分块做不对，后面全是白费

OpenAI有哪些AI模型？2026年GPT-4与GPT-3.5等如何选择

AIAI Summary (BLUF)

引言：AI 记忆难题迎来突破性进展

核心突破：ASMR 系统与 LongMemEval 基准测试

什么是 ASMR？

攻克最严苛的测试：LongMemEval

技术架构：多智能体协同的革新设计

第一阶段：并行信息摄取

第二阶段：主动推理检索

第三阶段：专业化答案生成

超越实验：Supermemory 的宏大愿景

记忆 vs. RAG：本质区别

核心产品能力

结论：记忆——AI 进化的下一块拼图

常见问题（FAQ）

Supermemory的ASMR系统与传统RAG方法有什么根本区别？

ASMR系统在LongMemEval基准测试中表现如何？为什么这个测试很重要？

ASMR系统的多智能体架构是如何工作的？

相关文章

深度实测：GLM-5.2长上下文与Kimi K2.7国际化，差距在哪

实测OpenAI API：gpt-3.5和gpt-4差距到底在哪

RAG七步工作流：分块做不对，后面全是白费

OpenAI有哪些AI模型？2026年GPT-4与GPT-3.5等如何选择