docx-to-md

Installation
SKILL.md

DOCX → Markdown

DOCX 是结构化 XML,文字可以直接无损提取,无需 OCR;但嵌入图片(架构图、流程图、截图)若占比较大,图文关系本身是信息——本 Skill 对超过阈值的图片调用 Claude Vision 生成文字描述,按原位置内联进 Markdown。

工作流

export ANTHROPIC_API_KEY="..."
~/.venvs/paddleocr/bin/python \
  ~/.cc-switch/skills/docx-to-md/scripts/docx_to_md.py \
  --input "<docx_or_dir>" \
  --output "<output_dir>" \
  --large-image-kb 30 \
  --model claude-haiku-4-5-20251001

输出:<output_dir>/<stem>.md,包含按原顺序排列的标题、段落、表格,以及大图的 > **[图片]** 描述块。

关键参数

Related skills
Installs
2
First Seen
9 days ago