GEO

LLMs.txt是什么?2026年AI爬虫优化新标准详解

2026/3/4
LLMs.txt是什么?2026年AI爬虫优化新标准详解
AI Summary (BLUF)

LLMs.txt is a proposed standard that helps AI crawlers better understand and utilize website content by providing structured, machine-readable information in Markdown format, potentially improving visibility in AI-generated responses.

原文翻译: LLMs.txt是一个拟议标准,通过以Markdown格式提供结构化、机器可读的信息,帮助AI爬虫更好地理解和利用网站内容,可能提高在AI生成回复中的可见性。

什么是 LLMs.txt

LLMs.txt 是一个拟议的技术标准,旨在帮助大型语言模型更有效地理解和使用网站内容。其核心思想是为 AI 爬虫提供一个结构化的内容指南,而非任由其在网站中漫无目的地抓取。

LLMs.txt 是一个拟议的技术标准,旨在帮助大型语言模型更有效地理解和使用网站内容。其核心思想是为 AI 爬虫提供一个结构化的内容指南,而非任由其在网站中漫无目的地抓取。

该标准类似于为搜索引擎设计的 robots.txt 和网站地图,但其专门针对可能利用网站内容进行问答或生成回复的 AI 模型。有观点认为,实施 llms.txt 可能有助于网站在 AI 生成的回答中获得更准确的引用,并可能带来潜在的推荐流量。

该标准类似于为搜索引擎设计的 robots.txt 和网站地图,但其专门针对可能利用网站内容进行问答或生成回复的 AI 模型。有观点认为,实施 llms.txt 可能有助于网站在 AI 生成的回答中获得更准确的引用,并可能带来潜在的推荐流量。

LLMs.txt 旨在解决什么问题?

LLMs.txt 的提出,主要是为了应对当前 AI 爬虫在理解现代网站时面临的两个主要挑战:

LLMs.txt 的提出,主要是为了应对当前 AI 爬虫在理解现代网站时面临的两个主要挑战:

  • 现代网站的可读性差:许多 AI 爬虫仅能解析基本的 HTML,难以处理通过 JavaScript 动态加载的内容。llms.txt 提供了一种清晰、静态的结构化格式,便于 AI 快速消化关键信息。
    • 现代网站的可读性差:许多 AI 爬虫仅能解析基本的 HTML,难以处理通过 JavaScript 动态加载的内容。llms.txt 提供了一种清晰、静态的结构化格式,便于 AI 快速消化关键信息。
  • 网站信息过载与噪音:网站通常包含大量页面,AI 爬虫难以自动区分核心内容与次要或过时信息(如旧的博客文章)。llms.txt 可以指引 AI 关注最重要的页面,从而生成基于更优质信息的回复。
    • 网站信息过载与噪音:网站通常包含大量页面,AI 爬虫难以自动区分核心内容与次要或过时信息(如旧的博客文章)。llms.txt 可以指引 AI 关注最重要的页面,从而生成基于更优质信息的回复。

此外,该标准也可能提升大型语言模型训练过程的效率。通过提供高质量、高相关性的内容指引,可以减少模型在无关或低质量数据上消耗的计算资源。

此外,该标准也可能提升大型语言模型训练过程的效率。通过提供高质量、高相关性的内容指引,可以减少模型在无关或低质量数据上消耗的计算资源。

LLMs.txt 文件的结构解析

根据提议的标准,llms.txt 文件应使用 Markdown 格式进行结构化和编写。Markdown 是一种轻量级标记语言,使用纯文本语法创建结构化文档,易于人类阅读和机器解析。

根据提议的标准,llms.txt 文件应使用 Markdown 格式进行结构化和编写。Markdown 是一种轻量级标记语言,使用纯文本语法创建结构化文档,易于人类阅读和机器解析。

文件中常用的 Markdown 元素包括:

文件中常用的 Markdown 元素包括:

  • #, ##, ###: 分别代表 H1, H2, H3 标题,用于组织内容层级。
    • #, ##, ###: 分别代表 H1, H2, H3 标题,用于组织内容层级。
  • >: 用于块引用,可突出重要描述或说明。
    • >: 用于块引用,可突出重要描述或说明。
  • -*: 用于创建无序列表,列举项目。
    • -*: 用于创建无序列表,列举项目。
  • [链接文本](URL): 用于创建超链接,指向网站的具体内容。
    • [链接文本](URL): 用于创建超链接,指向网站的具体内容。
  • :描述: 在链接后添加描述,帮助解释链接内容。
    • :描述: 在链接后添加描述,帮助解释链接内容。
  • ```代码块```: 用于展示技术示例或 API 使用片段。
    • ```代码块```: 用于展示技术示例或 API 使用片段。

官方规范提供了一个基础示例,但对于内容复杂的网站,可以增加更多结构,如使用多级标题、表格或详细的代码块。只要语法有效,额外的结构能为 AI 爬虫提供更丰富的上下文。

官方规范提供了一个基础示例,但对于内容复杂的网站,可以增加更多结构,如使用多级标题、表格或详细的代码块。只要语法有效,额外的结构能为 AI 爬虫提供更丰富的上下文。

基础示例:

# 公司名称
> 关于公司业务的简要描述

## 产品
- [产品 1](https://example.com/product-1): 该产品的描述
- [产品 2](https://example.com/product-2): 该产品的描述

## 文档
- [入门指南](https://example.com/docs/getting-started): 平台介绍
- [API 参考](https://example.com/api): 完整的 API 文档

行业采用现状

目前,已有部分面向开发者和 SaaS 的公司开始在其网站上部署 llms.txt 文件。然而,整体采用率仍然很低。根据 NerdyData 的数据,截至 2025 年7月,仅有 951 个域名部署了该文件。

目前,已有部分面向开发者和 SaaS 的公司开始在其网站上部署 llms.txt 文件。然而,整体采用率仍然很低。根据 NerdyData 的数据,截至 2025 年7月,仅有 951 个域名部署了该文件。

一些先行者包括:

一些先行者包括:

品牌 文件关注点 结构特点
Hugging Face 开发者文档 使用多级标题(#/##/###/####)划分板块,包含完整代码示例、大量链接和实用说明,像一个全面的知识库。
Vercel 开发者文档 以标题、描述和标签开头,使用清晰的标题组织逻辑部分,每个部分下提供分步说明和实用代码示例。
Zapier 开发者文档 结构相对基础,使用少量标题,主要由带描述的链接列表构成。
Cal.com 开发者文档 顶部使用标题后,直接跳转到一长串未分组的链接列表,缺乏小节和摘要。

值得注意的是,各公司的实现方式差异很大,这完全可行。只要文件是有效的、机器可读的 Markdown 格式,AI 系统就能处理。此外,目前这些案例主要专注于“开发者文档”部分,而非整个网站。

值得注意的是,各公司的实现方式差异很大,这完全可行。只要文件是有效的、机器可读的 Markdown 格式,AI 系统就能处理。此外,目前这些案例主要专注于“开发者文档”部分,而非整个网站。

现阶段是否应该采用 LLMs.txt

对于大多数网站所有者而言,除非出于实验或前瞻性布局的目的,否则目前投入精力部署 llms.txt 的性价比可能不高。

对于大多数网站所有者而言,除非出于实验或前瞻性布局的目的,否则目前投入精力部署 llms.txt 的性价比可能不高。

关键原因在于,llms.txt 目前仅是一个社区提议的标准,而非被主流 AI 公司官方采纳并遵循的规范。包括 OpenAI、Google 和 Anthropic 在内的主要大型语言模型提供商,均未公开表示其网络爬虫会识别或使用 llms.txt 文件。谷歌的 John Mueller 也在 Bluesky 上证实了这一点。

关键原因在于,llms.txt 目前仅是一个社区提议的标准,而非被主流 AI 公司官方采纳并遵循的规范。包括 OpenAI、Google 和 Anthropic 在内的主要大型语言模型提供商,均未公开表示其网络爬虫会识别或使用 llms.txt 文件。谷歌的 John Mueller 也在 Bluesky 上证实了这一点。

如何创建并部署 LLMs.txt 文件(分步指南)

如果您决定进行尝试,以下是创建和部署 llms.txt 的基本步骤。由于涉及技术操作,建议由开发人员协助完成。

如果您决定进行尝试,以下是创建和部署 llms.txt 的基本步骤。由于涉及技术操作,建议由开发人员协助完成。

1. 确定要展示的内容

首先,规划您希望 AI 爬虫重点关注网站的哪些部分。如果为整个网站创建,至少应考虑以下页面:

首先,规划您希望 AI 爬虫重点关注网站的哪些部分。如果为整个网站创建,至少应考虑以下页面:

  • 产品或服务页面
    • 产品或服务页面
  • 最新博客文章
    • 最新博客文章
  • 定价页面
    • 定价页面
  • “关于我们”页面
    • “关于我们”页面
  • 联系页面
    • 联系页面

2. 创建 Markdown 文件

使用文本编辑器(如 VS Code)创建一个名为 llms.txt 的新文件,并按 Markdown 格式编写内容。一个参考结构如下:

使用文本编辑器(如 VS Code)创建一个名为 llms.txt 的新文件,并按 Markdown 格式编写内容。一个参考结构如下:

# 网站名称
> 网站的简要描述

重要说明:
- 业务的关键差异化优势或重要细节
- 关于业务范围的其他重要说明
- 帮助定义服务的第三个关键点

## 产品
- [产品名称 1](https://example.com/product-1): 产品主要功能与优点的简短描述
- [产品名称 2](https://example.com/product-2): 产品主要功能与优点的简短描述

## 博客内容
- [博客文章标题 1](https://example.com/blog-post-1): 文章内容与价值的简要说明
- [博客文章标题 2](https://example.com/blog-post-2): 文章内容与价值的简要说明

## 公司信息
- [关于我们](https://example.com/about): 公司背景、使命与团队信息
- [联系我们](https://example.com/contact): 联系团队的方式
- [定价](https://example.com/pricing): 产品计划、功能与费用概述

3. 将文件上传至网站

将完成的文件上传到网站服务器的正确位置,以便 AI 爬虫能够访问:

将完成的文件上传到网站服务器的正确位置,以便 AI 爬虫能够访问:

  • 针对整个网站:上传至网站根目录(例如 public_html/),使其可通过 https://yourdomain.com/llms.txt 访问。
    • 针对整个网站:上传至网站根目录(例如 public_html/),使其可通过 https://yourdomain.com/llms.txt 访问。
  • 针对特定部分(如文档):上传至相应的子目录(例如 docs/),使其可通过 https://docs.yourdomain.com/llms.txt 访问。
    • 针对特定部分(如文档):上传至相应的子目录(例如 docs/),使其可通过 https://docs.yourdomain.com/llms.txt 访问。

操作通常通过网站托管控制面板(如 cPanel)的文件管理器完成。上传后,请直接访问该 URL 以确认文件可正常访问。您也可以使用网站审计工具进行检查。

操作通常通过网站托管控制面板(如 cPanel)的文件管理器完成。上传后,请直接访问该 URL 以确认文件可正常访问。您也可以使用网站审计工具进行检查。

最后,请务必定期维护和更新 llms.txt 文件,及时添加新内容链接并移除已过时的页面链接,以确保其始终反映网站的最新和核心内容。

最后,请务必定期维护和更新 llms.txt 文件,及时添加新内容链接并移除已过时的页面链接,以确保其始终反映网站的最新和核心内容。

← 返回文章列表
分享到:微博

版权与免责声明:本文仅用于信息分享与交流,不构成任何形式的法律、投资、医疗或其他专业建议,也不构成对任何结果的承诺或保证。

文中提及的商标、品牌、Logo、产品名称及相关图片/素材,其权利归各自合法权利人所有。本站内容可能基于公开资料整理,亦可能使用 AI 辅助生成或润色;我们尽力确保准确与合规,但不保证完整性、时效性与适用性,请读者自行甄别并以官方信息为准。

若本文内容或素材涉嫌侵权、隐私不当或存在错误,请相关权利人/当事人联系本站,我们将及时核实并采取删除、修正或下架等处理措施。 也请勿在评论或联系信息中提交身份证号、手机号、住址等个人敏感信息。