pdf-to-md

Installation
SKILL.md

PDF / 图片 → Markdown

格式路由

输入 路径 说明
PDF(原生文字,平均 >50 字符/页) pdf_to_md.py (pymupdf) 秒级完成,无 API 消耗
PDF(扫描 / 图像) ocr_extract.py (PaddleOCR 云端) 自动识别后跳过快速路径
图片(JPG / PNG / BMP / TIFF / WEBP) ocr_extract.py 仅 PaddleOCR 路径

工作流

Step 1:原生文字 PDF 快速提取

先对所有 PDF 跑快速提取——原生文字 PDF 直接出结果,扫描 PDF 自动跳过并打印 scanned 提示:

Related skills
Installs
2
First Seen
9 days ago