如何在 OpenClaw 中做自己的知识库
知识库介绍:
问题1:OpenClaw 的“知识库”本质是什么?
OpenClaw 没有那种“把文件上传到某个平台让它训练”的传统 KB。它更像:
把你的 md 文件放到 Agent Workspace(工作区)里
然后通过 工具(读文件/grep/索引搜索)+ Skills(教它怎么找、怎么用)
在你提问时,让它先检索命中再回答(类似本地 RAG(检索增强生成),但更轻量、更可控)
问题2:kb 是什么?是不是缩写?
先说结论:
kb = Knowledge Base(知识库) 的行业通用缩写
这是整个 AI / 搜索 / 信息系统领域的标准叫法,不是你随便起的。
但我们不用这些名字的原因是:
kb = 不只是文件,而是:
📚 可被 agent 用来推理、引用、回答的问题源
这是语义层级的区别。
问题3:知识库有没有分类的级别?如果有,openclaw的 kb 现在是什么级别?
知识库是按成熟度分级别的,
用openclaw可以做到:
✅ INDEX
✅ 检索脚本
✅ 证据链
✅ 规则约束
👉 openclaw的知识库,可达到 L4 企业级 KB
问题4:Agent 为什么会优先查知识库?是在哪设置的?
OpenClaw 本身 不会自动优先查你本地 kb,完全是你“用规则驯化出来的”
优先检索行为 = 由 Agent.md强制注入给模型的,Prompt Engineering(系统级提示工程)
OpenClaw 的真实工作原理(简化版本):
暂时无法在飞书文档外展示此内容
合成一个:
超级 Prompt
然后喂给大模型。
AGENTS.md 是什么? --》Agent 的“宪法”
在大模型眼里:
USER 提示 < AGENTS
AGENTS < SYSTEM
你写进去的规则,权重极高。
大模型有 3 个优先级:
你把 KB 规则放在 Agent 层,而且写成:
MANDATORY
MUST
禁止
系统级
模型会当成“法律”。
为什么 Agent 会查 kb?
AGENTS.md = 行为约束注入器
如何在openclaw中创建自己的知识库
第1步:把 md 放到“工作区知识库目录”
1.1 找到你 main agent 的 workspace 路径
通常默认是:
Windows(WSL/类 Unix)风格:
~/.openclaw/workspace
官方说明:workspace 路径来自配置,是 agent 的工作根目录。
建议你在 workspace 下建立固定目录:
1.2 复制你的输出 md
所有转换后的MD文档,放到 ...\workspace\kb\docs\下。
注意:生成的MD文档需要清洗,去重。
生成MD文档的程序:
MD文档清洗,去重的程序(去重后自动生成INDEX.md文件,不需要手动编写):
第2步:让 OpenClaw “知道”该去 kb/ 里检索
写一个“总索引”INDEX.md(提高命中率)
在 C:\Users\Admin\.openclaw\workspace\kb\INDEX.md 新建内容
# KB INDEX
| 序号 | 文档 | 路径 |
|------|------|------|
| 1 | 07__模块五:如何结合自身工作推进企业新质变革 | kb/docs/07__模块五:如何结合自身工作推进企业新质变革.md |
| 2 | 12__模块五:如何结合自身工作推进企业新质变革 | kb/docs/12__模块五:如何结合自身工作推进企业新质变革.md |
| 3 | 2、领导力教育:激活组织潜能、重塑企业未来的20字诀 | kb/docs/2、领导力教育:激活组织潜能、重塑企业未来的20字诀.md |
| 4 | 3、智能项目实施方案——克劳士比 | kb/docs/3、智能项目实施方案——克劳士比.md |
| 5 | 6、PONC 赋能 | kb/docs/6、PONC 赋能.md |
| 6 | 8、零缺陷管理改进法 | kb/docs/8、零缺陷管理改进法.md |
> Updated: 2026-02-13 15:44:263)让 OpenClaw “默认先查 kb/”:编辑 AGENTS.md(关键)
在文件顶部追加这一段(建议放最上面):
C:\Users\Admin\.openclaw\workspace\AGENTS.mdAGENTS.md新建知识库的写法模板:
## Local Knowledge Base Rules (MANDATORY)
Local Knowledge Base Rules (MANDATORY) - Multi KB
你有一个本地知识库目录(位于 workspace 内):
- `kb/`(零缺陷/培训等)
强制流程:
1) 先读取索引:
- `kb/INDEX.md`
2) 先做“知识库路由判断”:根据用户问题选择最匹配的知识库(只能选一个作为主库)。
3) 只允许在“被选中的知识库”的 `docs/` 内检索与引用原文。
4) 回答末尾必须标注来源路径:`kb/.../*.md`
5) 若主库证据不足:
- 先扩展到同一知识库的其它文档
- 仍不足再明确说明“该知识库未找到足够证据”,不得编造
禁止行为:
- 未检索 kb 即回答
- 仅凭模型记忆推测
- 虚构课程/资料内容这一步的本质是:把“检索 kb/”写进 agent 的长期运行规则。以后你问它“20字诀是什么?”它就会先去 kb/ 找,而不是靠模型猜。
4)重启(或新开会话)让规则生效
openclaw gateway restart5)验证是否真的“当知识库在用”(三条测试指令)
用 OpenClaw 给 agent 发下面三条消息(按顺序):
测试 1:只查索引(确认能读到 kb)
请打开并阅读 kb/INDEX.md,告诉我目前知识库有哪些资料包,各自关键词是什么?末尾输出【KB_OK】。✅ 通过标准:能复述两个资料包,并在末尾出现【KB_OK】。
测试 2:定位文件(确认会检索目录)
在 kb/docs/ 里查找包含“组织潜能”或“20字诀”的文件名,列出命中清单(只要文件名)。✅ 通过标准:能列出若干 md 文件名/章节文件名。
测试 3:命中后回答(确认不是“瞎编”)
基于 kb/ 内容回答:20字诀的核心要点是什么?用5条要点总结,并在每条后面标注来源文件路径。✅ 通过标准:每条后面都带 kb/... 路径。