cw-retriever

SKILL.md

本地知识库检索 Skill(cw-retriever)

知识库目录说明

  • 知识库存放在一个根目录下,包含多种文件类型(.md/.txt.pdf.xlsx 等),通常按类型或业务用途拆分为多级子目录
  • 采用分层目录索引文件
    • 根目录有一个 data_structure.md,说明主要的「领域目录」及其用途,并为每个重要子目录/文件提供一句话业务摘要和若干 Tags(高频搜索词)
    • 每个领域目录下可以有自己的 data_structure.md,说明该目录下有哪些子目录/文件及各自用途,同样需要为关键文件维护「摘要 + Tags」信息,方便在 grep 阶段以极低成本定位到目标子目录
    • 更深一层的子目录也可以继续有 data_structure.md,形成多级索引树
    • 对于深层但极其重要的文件,应在根目录的 data_structure.md 中建立“虚拟软链接”条目(记录相对路径 + 摘要 + Tags),实现语义扁平化,减少递归查找层数
  • 知识库根目录约定:
    • 默认认为知识库位于当前项目根目录下的 knowledge/ 目录
    • 如果用户在对话中明确指定了其他路径,则以用户指定的路径为准
    • 当默认路径不存在时,应向用户确认实际的知识库根目录位置
    • 所有由检索过程生成的临时文件(如 .txt/.csv/.png 等)必须统一放在知识库根目录下的 tmp/ 目录中

data_structure.md 推荐模版

根目录 knowledge/data_structure.md 建议采用类似结构(可用表格或列表形式表达):

Installs
1
First Seen
Apr 21, 2026