docx-to-md

Installation

SKILL.md

DOCX → Markdown

DOCX 是结构化 XML，文字可以直接无损提取，无需 OCR；但嵌入图片（架构图、流程图、截图）若占比较大，图文关系本身是信息——本 Skill 对超过阈值的图片调用 Claude Vision 生成文字描述，按原位置内联进 Markdown。

工作流

export ANTHROPIC_API_KEY="..."
~/.venvs/paddleocr/bin/python \
  ~/.cc-switch/skills/docx-to-md/scripts/docx_to_md.py \
  --input "<docx_or_dir>" \
  --output "<output_dir>" \
  --large-image-kb 30 \
  --model claude-haiku-4-5-20251001

输出：<output_dir>/<stem>.md，包含按原顺序排列的标题、段落、表格，以及大图的 > **[图片]** 描述块。

关键参数

Related skills

More from ocozyo/doc-to-md-skills

Installs

2

Repository

ocozyo/doc-to-md-skills

First Seen

9 days ago

Security Audits

Gen Agent Trust HubPass