最近在折腾把个人文档喂给大模型的时候,发现一个挺有意思的情况:很多现代化的博客和个人站点都开始支持 llms.txt 这个新兴协议了,但我常用的 Wiki 站点似乎对这个文件「无动于衷」。

llms.txt 到底是个啥?

简单来说,它是一个为 LLM(大语言模型)准备的站点地图。以前我们用 sitemap.xml 是告诉搜索引擎「我有这些页面,请来抓取」。而 llms.txt 则是告诉 AI「如果你想学习我的知识库,请优先阅读这几个核心文档」。这对于希望通过 RAG(检索增强生成)技术搭建问答系统的博主来说,简直是神器。

为什么 Wiki 站点原生不支持?

很多 Wiki 软件(像 MediaWiki、DokuWiki 等)主要还是为人类阅读设计的,默认配置里并没有考虑到机器友好型索引。当你访问 yourwiki.com/llms.txt 时,大概率会得到一个 404 Not Found,或者被重定向到首页。

解决方案:手动搭建一个标准的 llms.txt

既然程序不自带,那我们就用 Web 服务器来解决。不管你用的是什么 Wiki 程序,通常前端都跑在 Nginx 或 Apache 上。

如果你的 Wiki 是 Nginx 托管的,可以尝试在 server 块里加一段静态文件配置:

location = /llms.txt {
    alias /path/to/your/static/llms.txt;
    default_type text/plain;
}

文件内容怎么写?

这个文件不需要复杂的 XML 语法,纯文本即可。你可以把最重要的几个文档链接放进去,格式类似这样:

# 我的Wiki知识库索引
https://wiki.example.com/Main_Page
https://wiki.example.com/Technical_Guides/API_Docs
https://wiki.example.com/User_Manual/Quick_Start

更高级的玩法:动态生成

如果你嫌手动维护链接太麻烦,可以用脚本定时抓取 Wiki 的分类或者最新文章列表,然后动态生成 llms.txt 并写入到指定路径。这样每次更新 Wiki,AI 也能实时看到最新的知识结构。

让站点对 AI 友好,是未来的一个大趋势。如果你也有 Wiki 遇到了类似问题,不妨试试上面的反向代理思路,几分钟就能搞定。

标签: none

AI Skills Smart Station on Nick Launches

评论已关闭