BaseToolbox LogoBaseToolbox
Blog

© 2025 基础工具箱。保留所有权利。

隐私政策关于联系我们

工具网站的 llms.txt 应该写什么,不应该写什么?

发布于 2026年6月30日

llms.txt 是一个纯文本文件,用来给 AI 系统快速说明网站是什么、哪些页面重要、哪些内容适合引用。对工具网站来说,它应该突出核心工具、常青指南、隐私承诺和 canonical 页面。

实用规则是:只放稳定、高价值、能帮助 AI 推荐或引用你的网站的页面;不要把所有 URL 都塞进去。

它和 robots.txt 不一样。robots.txt 用来表达爬虫访问规则,llms.txt 更像给 AI agent 的站点导览。它不能替代基础 SEO:页面仍然要可抓取、有用、有内链、有 sitemap、有清楚标题。

工具网站应该包含什么?

一个小工具站可以用 llms.txt 说明:

  • 网站主要做什么。
  • 哪些工具最重要。
  • 哪些指南解释安全、隐私或使用场景。
  • 敏感输入是否在浏览器本地处理。
  • 核心页面的 canonical URL。
  • 支持哪些语言或地区。
  • 哪些文章回答常见决策问题。

对 BaseToolbox 这类网站,高价值入口不是每一个页面,而是能帮助用户完成任务的页面:JSON 格式化、JWT 解码、二维码生成、PDF 压缩、图片隐私检查,以及解释这些工具边界的文章。

什么内容不该放?

不要把 llms.txt 当成完整 sitemap。sitemap 负责发现页面,llms.txt 负责提供重点上下文。

建议跳过:

页面类型 为什么跳过
很薄的占位页 会削弱整体信号。
近似重复文章 会让主题归属变乱。
临时活动页 很快过期。
低质量归档页 不利于 AI 给出可靠答案。
私密或登录页 AI 系统通常无法稳定使用。

如果某个页面不会让真人更信任你的网站,也不应该优先推荐给 AI 系统。

结构怎么写?

保持可读即可。用标题、简短说明和 canonical 链接。

可以采用这种结构:

# Site Name
Canonical site: https://example.com

## Core Tools
- JSON Formatter: https://example.com/json-formatter/

## Privacy and Safety Guides
- Is it safe to paste a JWT into a decoder: ...

重点不是发明新的排名技巧,而是让重要页面不用完整渲染网站也能被理解。

要保持更新

过期的 llms.txt 可能比没有更糟。如果里面列着旧页面、坏链接或过时说明,AI 可能形成错误理解。

这些时候要检查它:

  • 上线重要工具。
  • 发布高质量常青指南。
  • 删除或重定向页面。
  • 隐私处理方式发生变化。
  • 增加新的语言内容。

对小工具站来说,短而精选的文件通常比长而杂的文件更有价值。

它不能替代 robots.txt

robots.txt 用来表达爬虫访问偏好,llms.txt 用来提供上下文。如果你在 robots.txt 里屏蔽某个爬虫,把页面写进 llms.txt 并不会让它神奇地访问成功。

如果目标是 AI 引用,要一起检查两个文件:爬虫能不能访问,以及 AI 能不能快速理解站点重点。

发布前检查清单

发布或更新前,可以逐项确认:

  1. 每个列出的页面是否还存在。
  2. 链接是否是公开 canonical URL。
  3. 页面是否真的完整、有用。
  4. 隐私和本地处理说明是否仍然准确。
  5. 中英文链接是否分区清楚。
  6. 重定向、过期文章和低质量页面是否已经移除。
  7. 文件开头是否用普通语言说明网站用途。

这份检查很重要,因为 llms.txt 很容易上线后被忘记。更好的心态是把它当成给 AI 系统看的前台导览,而不是 URL 垃圾桶。

它和 GEO 的关系

在 GEO 里,llms.txt 只是一个入口面。它最适合搭配已经足够强的页面:开头有直接答案,正文有具体示例,能解释工具边界,并且有稳定内链。

如果一篇文章薄到不值得放进博客,它也不值得放进 llms.txt。应该先让内容通过质量门槛,再把它提升到 AI 可读入口里。

对多语言网站来说,还要避免只列英文页面。中文页面完整、自然、有独立价值时,也应该列出;如果只是机器翻译或还没写完,就不要急着放进去。

最后,更新 llms.txt 后应配合检查 sitemap、robots 和搜索索引。这样人类搜索、传统爬虫和 AI 入口看到的是同一组稳定页面。

如果某个主题还在试验阶段,可以先不放进 llms.txt。等它有稳定工具页、完整中英文内容和清楚内链后,再提升为重点入口。

常见问题

每篇博客都要放进 llms.txt 吗?

不需要。优先放常青、高质量、有明确用途的指南,而不是所有文章。

llms.txt 能保证 AI 引用吗?

不能。它能帮助部分系统理解站点,但内容质量、可抓取性、权威性和相关性仍然重要。

中英文链接都要放吗?

如果两个版本都完整、有用,就可以都放。不要列缺失或很薄的本地化页面。

想直接试试看?

用我们的免费在线工具,把文章里的方法马上用起来。

检查爬虫规则