GEO

DocMason如何帮助深度研究私有工作文件?(附证据优先知识库构建)

2026/4/17
DocMason如何帮助深度研究私有工作文件?(附证据优先知识库构建)

AI Summary (BLUF)

DocMason is a repo-native agent application that enables deep research over private work files by building a local, evidence-first knowledge base with strict provenance. It runs on Codex for macOS, allowing users to compile documents into structured, multimodal evidence bundles for traceable answers.

原文翻译: DocMason 是一款基于仓库的原生代理应用程序,通过构建具有严格溯源性的本地、证据优先的知识库,实现对私有工作文件的深度研究。它在 macOS 的 Codex 上运行,允许用户将文档编译成结构化、多模态的证据包,以获得可追溯的答案。

一个为深度研究私有工作文件而生的仓库原生智能体应用。

仓库即应用。Codex 是运行时。

构建一个本地化、证据优先且具备可追溯性的知识库。

A repo-native agent app for deep research over private work files.

The repo is the app. Codex is the runtime.

Build a local, evidence-first knowledge base with provenance.

Download DocMason

Platform Supported formats License Total downloads

已经在为 ChatGPT 付费?macOS 版 Codex 已包含在你的订阅计划中。将未使用的算力转化为本地的“第二大脑”。
观看▶️ 演示视频,了解 DocMason 如何对本地复杂的办公文件进行深度研究。
通过这个▶️ 3分钟设置教程视频,快速上手。
Already paying for ChatGPT? Codex for macOS is included in your plan. Turn that unused capacity into a local Second Brain.
Watch the ▶️ video demo to see how DocMason performs deep research on local complex office files.
Get zero-to-working in minutes with this ▶️ 3-min setup tutorial video.

核心理念:答案必须严格可追溯

大多数工作区 AI 工具将你复杂的办公文档扁平化为单一、非结构化的文本块。它们或许能总结一个文件或检索一段零散的引文,但一旦你的研究变得复杂,这种假象就会破灭。你失去了表格、幻灯片布局、隐藏的注释——并且几乎无法验证 AI 的答案究竟来自何处。

DocMason 基于一个不同的理念构建:答案必须严格可追溯。它将你的私有演示文稿、电子表格、PDF 和电子邮件编译成一个基于文件的本地知识库。你的 AI 智能体不再是处理匿名的文本块,而是在结构化的、多模态的证据包上进行推理。它不是一个云服务,也不是一个轻量级的包装器。它是一个本地仓库,作为深度研究的 AI 应用在 Codex 上运行。没有隐藏的后端,没有云端数据摄取。只有你的文件,以及你真正可以信任的答案。

Most workspace AI tools flatten your complex office documents into a single, unstructured text blob. They might summarize a file or retrieve a stray quote, but once your research gets complex, the illusion breaks. You lose the tables, the slide layouts, the hidden notes—and it becomes impossible to verify where the AI's answer actually came from.

DocMason is built on a different thesis: answers must be strictly traceable. It compiles your private decks, spreadsheets, PDFs, and emails into a local, file-based knowledge base. Instead of chatting with anonymous text chunks, your AI agent reasons over structured, multimodal evidence bundles. It’s not a cloud service or a lightweight wrapper. It is a local repo running as a deep-research AI app on Codex. No hidden backends, no cloud ingestion. Just your files, and answers you can actually trust.

工作原理:生产级运行时

DocMason 旨在强制执行严格的数据契约和来源边界。仓库持有真相;智能体进行推理。

DocMason Architecture

DocMason is designed to enforce strict data contracts and provenance boundaries. The repo holds the truth; the agent does the reasoning.

为什么需要 DocMason

大多数文档 AI 工具将复杂的企业文件映射为扁平、不可读的文本字符串。它们剥离了关键的结构和格式语义:

  • 幻灯片演示文稿:视觉布局、演讲者备注以及图表与文本的关系被丢弃。
  • 电子表格:多工作表引用和嵌套表格会破坏现有的解析器。
  • 格式即语义:关键信号(如表示“风险”的红色文本或表示层级的缩进)被抹去。
  • 跨文档推理:多部分提案被割裂,使得全局综合分析变得不可能。

DocMason 通过强制 AI 尊重原始文档结构和视觉语义来解决这个问题。它生成确定性的、基于文件的证据,运行强大的离线检索和追踪算法,并通过严格的代码规则验证生成的知识库——所有操作都在本地进行,数据不会离开你的机器。仓库持有真相。智能体进行推理。

Most document AI tools map complex corporate files into flat, unreadable text strings. They strip out critical structural and formatting semantics:

  • Slide Decks: Visual layout, presenter notes, and chart-text relationships are discarded.
  • Spreadsheets: Multi-sheet references and nested tables break existing parsers.
  • Format-as-Semantics: Critical signals (like red text for "Risk" or indentation for hierarchies) are erased.
  • Cross-Document Reasoning: Multi-part proposals are disconnected, making global synthesis impossible.

DocMason addresses this by forcing AI to respect original document structure and visual semantics. It produces deterministic file-based evidence, runs strong offline retrieval and trace algorithms, and validates the resulting knowledge base through strict code rules — all locally, with nothing leaving your machine. The repo holds the truth. The agent does the reasoning.

两种简单的开始方式

开始使用无需任何开发经验。只需放入你的文件,让 AI 智能体处理其余工作。

Two ways to reach your first answer

Getting started requires zero developer experience. Just drop your files and let your AI agent handle the rest.

  • 路径 A:从小规模开始
    将少量工作文件(.pptx.docx.xlsx、PDF)放入 DocMason/original_doc/ 文件夹。在 Codex 中打开 DocMason 文件夹,自然地提出你的问题。DocMason 会智能地引导你完成环境设置,并在后台静默构建知识库——只需在提示时批准即可。之后,你可以继续在 original_doc/ 中添加或修改文件;在原生路径上,DocMason 可以静默地、增量地同步已发布的知识库,而不是强制完全重启。

    Path A: Start Small
    Drop a handful of work files (.pptx, .docx, .xlsx, PDFs) into the DocMason/original_doc/ folder. Open the DocMason folder in Codex, and ask your question naturally. DocMason intelligently guides you through environment setup and quietly builds the knowledge base in the background — just approve when prompted. After that, you can keep adding or revising files inside original_doc/; on the native path, DocMason can quietly and incrementally sync the published knowledge base instead of forcing a full restart.

  • 路径 B:批量导入整个文件夹
    将你庞大的、部门级别的文件夹放入 DocMason/original_doc/。在 Codex 中打开 DocMason 文件夹。告诉 Codex:

    “请准备 DocMason 环境。”
    然后:
    “请构建知识库。”
    完成后,开始针对整个已发布的语料库提出复杂的研究问题。

    Path B: Stage Entire Folders
    Drop your massive, department-level folders into DocMason/original_doc/. Open the DocMason folder in Codex. Tell Codex:

    "Please prepare the DocMason environment."
    Then:
    "Please build the knowledge base."
    Once it's done, start asking complex research questions against the entire published corpus.

在一个有效的工作区内,你无需记忆内部命令。只需自然地与你的 AI 智能体对话即可。

Inside a valid workspace, you do not need to memorize internal commands. Just speak naturally to your AI agent.

在 macOS 上快速开始

📺 更喜欢视觉指南?观看 3 分钟完整设置教程视频👇

DocMason Setup Tutorial

Watch on YouTube

从下载到获得第一个可追溯答案的五步——无需开发经验。

Five steps from download to your first traceable answer — no developer experience required.

1. 下载、解压并放入你的文件
下载 DocMason,将其解压到 Mac 上的任意文件夹,然后将你的 .pptx.docx.xlsx.pdf 和其他工作文件拖入 DocMason/original_doc/

1. Download, unzip, and drop in your files
Download DocMason, unzip it to any folder on your Mac, then drag your .pptx, .docx, .xlsx, .pdf, and other work files into DocMason/original_doc/.

2. 在 Codex 中打开 DocMason 文件夹
启动 Codex for macOS(或 Claude Code),并将 DocMason 文件夹作为你的工作区打开。这是其操作模型——仓库是你的应用,智能体是你的运行时。

2. Open the DocMason folder in Codex
Launch Codex for macOS (or Claude Code) and open the DocMason folder as your workspace. This is the operating model — the repo is your app, the agent is your runtime.

3. 请你的智能体准备环境

“请准备 DocMason 环境。”
DocMason 将设置一个托管的本地 Python 环境,安装所需的依赖项,并在 LibreOffice 未安装时引导你完成安装。只需在提示时授予 Codex 完全访问权限

3. Ask your agent to prepare the environment

"Please prepare the DocMason environment."
DocMason will set up a managed local Python environment, install required dependencies, and guide you through LibreOffice installation if it's not already present. Just grant full access to Codex when prompted.

4. 构建知识库 (针对中大型语料库)

“请构建知识库。”
DocMason 将暂存、编译、验证你的文档,并将其发布到一个可搜索的证据层。对于少量文件,DocMason 可能会在你提出第一个问题时自动处理此步骤。

4. Build the knowledge base *(for

常见问题(FAQ)

DocMason 如何确保答案的可追溯性?

DocMason 通过构建本地、证据优先的知识库,将文档编译成结构化、多模态的证据包。每个答案都严格关联其原始来源,实现端到端的可追溯性。

在 macOS 上使用 DocMason 需要什么条件?

需要安装 Codex for macOS 作为运行时环境。DocMason 是专为 macOS 设计的仓库原生应用,可直接在 Codex 上运行,利用现有订阅的算力。

DocMason 支持哪些文件格式进行深度研究?

支持 Office、PDF 和 Text 等常见办公文档格式。它能将这些私有工作文件编译成结构化证据包,实现深度研究和可追溯查询。

← 返回文章列表
分享到:微博

版权与免责声明:本文仅用于信息分享与交流,不构成任何形式的法律、投资、医疗或其他专业建议,也不构成对任何结果的承诺或保证。

文中提及的商标、品牌、Logo、产品名称及相关图片/素材,其权利归各自合法权利人所有。本站内容可能基于公开资料整理,亦可能使用 AI 辅助生成或润色;我们尽力确保准确与合规,但不保证完整性、时效性与适用性,请读者自行甄别并以官方信息为准。

若本文内容或素材涉嫌侵权、隐私不当或存在错误,请相关权利人/当事人联系本站,我们将及时核实并采取删除、修正或下架等处理措施。 也请勿在评论或联系信息中提交身份证号、手机号、住址等个人敏感信息。