cw-retriever
SKILL.md
本地知识库检索 Skill(cw-retriever)
知识库目录说明
- 知识库存放在一个根目录下,包含多种文件类型(
.md/.txt、.pdf、.xlsx等),通常按类型或业务用途拆分为多级子目录 - 采用分层目录索引文件:
- 根目录有一个
data_structure.md,说明主要的「领域目录」及其用途,并为每个重要子目录/文件提供一句话业务摘要和若干 Tags(高频搜索词) - 每个领域目录下可以有自己的
data_structure.md,说明该目录下有哪些子目录/文件及各自用途,同样需要为关键文件维护「摘要 + Tags」信息,方便在 grep 阶段以极低成本定位到目标子目录 - 更深一层的子目录也可以继续有
data_structure.md,形成多级索引树 - 对于深层但极其重要的文件,应在根目录的
data_structure.md中建立“虚拟软链接”条目(记录相对路径 + 摘要 + Tags),实现语义扁平化,减少递归查找层数
- 根目录有一个
- 知识库根目录约定:
- 默认认为知识库位于当前项目根目录下的
knowledge/目录 - 如果用户在对话中明确指定了其他路径,则以用户指定的路径为准
- 当默认路径不存在时,应向用户确认实际的知识库根目录位置
- 所有由检索过程生成的临时文件(如
.txt/.csv/.png等)必须统一放在知识库根目录下的tmp/目录中
- 默认认为知识库位于当前项目根目录下的
data_structure.md 推荐模版
根目录 knowledge/data_structure.md 建议采用类似结构(可用表格或列表形式表达):