GordenImage2PPTX
GordenImage2PPTX — 图片 PPT → 可编辑 PPTX
一张一张处理每张图片,强制拆成四层再合成可编辑 .pptx(从下到上)。其中前三个图片层必须由 imagegen 生成或提取,文字层由 GPT 视觉能力提取并写成真文本框:
背景图(复刻) + 整体框架图(绿幕抠图,默认不切分) + 元素图标/装饰(绿幕抠图,切片) + 文字(GPT视觉提取)
🟣 直接转换原则:用户给出图片并要求转可编辑 PPTX 时,不要先扫描当前目录、历史输出或其它项目,去寻找/复用类似源页。直接把用户提供的当前图片作为唯一源图,按 B1-B9 流程提取背景图、框架图、元素图标和文字,建立新的 PPTX 文档。只有用户明确要求复用旧素材、续做某个历史输出、或指定已有源文件时,才读取对应历史文件。
🧱 任务隔离原则(防串文件):每次转换开始前必须创建唯一任务根目录
RUN_ROOT,例如image2pptx_runs/<时间戳>_<源图slug>/,并把本次所有中间产物、prompt、manifest、layout、预览、QA 和最终 PPTX 都写到该目录下。禁止把新任务直接写到工作区固定的editable/01、out/、qa/或slide-01/,也禁止从这些固定路径读取素材。若目录已存在,必须换一个新目录,不得复用或覆盖。
layout.json的图片路径必须在同一个RUN_ROOT内解析:单页 layout 优先省略assets_dir(让compose_pptx.py自动用 layout 所在目录),或写成绝对页目录;不得写"assets_dir": "editable/01"这类会受当前工作目录影响的相对路径。manifest 的copied_to也必须是RUN_ROOT内的绝对路径。
🟦 框架图 = 一页里「背景、元素图标/装饰/艺术字、普通文本」之外的所有图像:容器/卡片(含底色填充与标题条)、分隔/连接线、全部图表图形(折线/柱状/阶梯/饼图/坐标网格/趋势线)、缎带、装饰线条与色块——统统归框架图,一次性提取,且形状·大小·位置与原图 1:1 一致(别漏数据折线/装饰)。
🟨 艺术字 = 装饰元素,不是普通文本:凡是带有渐变颜色、书法/笔刷造型、形变、描边/阴影/纹理、徽章式排版或普通字体无法直接写出的文字,都归入 B4 图标/装饰层,以图片元素提取和摆放。例如封面大字“灵芝”。B7 GPT 视觉文本层只处理普通字体可直接还原的文字。