document-privacy-audit
Document Privacy Audit
概览
执行全文抽取与结构化检索,结合规则与语义判断定位隐私信息,输出带定位与风险等级的汇总报告。
工作流程
- 明确范围与交付
- 确认文件路径与格式、语言、是否包含扫描页。
- 明确隐私范围(仅 PII,还是包含财务/健康/凭据)。
- 约定输出格式(Markdown 报告 + JSON 明细,或仅报告)。
- 抽取全文并保留定位
- 优先使用
scripts/extract_text.py输出 JSONL,保留页码/段落/单元格定位。 - PDF 如无文本层,提示使用 OCR(
ocrmypdf或tesseract)后再抽取。
More from nanzhipro/questskills
wechat-article-fetcher
抓取微信公众号文章,支持全文提取、图文混排、图片本地化下载及概要生成。在需要访问微信公众号链接并转化为 Markdown 时调用。
82book-content-extractor
专业书籍核心内容萃取专家。基于语义深度分析,提炼书籍 50% 的核心高价值内容,构建费曼讲解主线。
9storytelling-super-skill
将平庸、模板化、AI 味重的草稿重构为更有人味、更有张力、更有说服力的叙事。Use when Codex needs to improve or design stories, speeches, essays, founder narratives, sales copy, leadership messaging, positioning narratives, or AI-generated drafts by applying RENT (Relatability, Ease, Novelty, Tension), Pyramid Principle, Big Idea, Story Spine, Hero's Journey, audience-muse alignment, vulnerability, taste-based editing, or explicit requests about Super Skill, Storytelling Economy, Vortex of Mid, 叙事升维, 共鸣, 钩子, 张力, 脆弱性, 品味, or 先独立思考后 AI 辅助.
3xiaoyuzhou-podcast-transcriber
Downloads Xiaoyuzhou podcasts, transcribes using FunASR, and generates raw, structured, and optimized text files. Invoke when user provides a Xiaoyuzhou episode link.
3epub-pro-converter
EPUB 高清转换专家。技术脚本生成出版级 PDF/MD,支持内置字体提取与高清排版重构。
2youtube-podcast-extraction
极客级 YouTube 播客提取与可视化方案。遵循电影感字幕视觉标准 (Cinema Style),通过词窗重叠算法去重字幕,并利用 Playwright 渲染高质量金句卡片。适用于需要将长视频转化为高价值社交分享内容的场景。
2