别再做“死 PPT”了,这个 GitHub 项目想把 AI 生成的豪华 PPT 变成可编辑文件
几秒钟速读版
这篇讲什么:
一个叫 Gorden Super PPT Skills 的 GitHub 项目,试图解决 AI PPT 最烦人的问题:图很好看,但不能真正编辑。为什么要看:
现在很多 AI 做 PPT,第一眼很炫,第二眼就尴尬。你想改一个字、挪一个图标、换一个模块,发现它本质上只是一张图。这个项目的思路是:先用 GPT 生成高质量图片 PPT,再把图片拆成背景、框架、图标、文本四层,重新拼成可编辑 PPTX。你能记住什么:
- https://github.com/GordenSun/GordenSuperPPTSkills
- 它不是 PPT 模板库,而是一套给 Codex 用的 Agent Skills。
- 核心链路分成 3 个技能:GordenImagePPTGen、GordenImage2PPTX、GordenSuperPPTSkill。
- 亮点不是“AI 能出图”,而是“图片 PPT 能能不能还原成可编辑 PPTX”。
- 它很强,但不轻。README 明确写到,图片转可编辑 PPTX 比较费额度,1 张图大概消耗 Plus 订阅 5 小时额度的 10%。
适合谁:
经常做商业计划书、课程课件、项目汇报、产品方案、咨询报告的人;也适合研究 Agent Skills、AI 办公自动化、PPT 生产链路的开发者。完整正文版
很多人用 AI 做 PPT,卡住的地方不是“能不能生成”。现在的模型已经很会做漂亮页面了。大标题、渐变背景、复杂卡片、图表、科技感装饰,一次出图就能让人觉得“这页挺像样”。你自己发现,一个图标不对,一个数字要改,一个标题太长。Gorden Super PPT Skills 盯上的就是这个缝隙。它的野心不是再做一个“AI 帮你生成 PPT”的玩具,而是把 AI PPT 生产拆成一条更完整的链路:先生成豪华图片版 PPT,再把图片 PPT 拆层还原,最后输出可编辑的 PPTX。这句话很猛,我不会照单全收。因为真正到生产环境里,PPT 的质量、可控性、成本、稳定性都要看实际任务。但这个项目确实抓住了一个关键矛盾:AI 生成的“视觉完成度”和人工后期的“编辑自由度”,长期是冲突的。第一条路,生成可编辑 PPT。好处是能改,坏处是经常设计感一般,像套模板。第二条路,生成整页图片。好处是好看,坏处是不可编辑,后期只能重做或硬抠。Gorden Super PPT Skills 的思路,是先接受“图片生成模型更擅长复杂视觉设计”这个现实,然后再用视觉解析和分层重建,把图片拆回 PPTX 结构。它负责生成“图片格式的 PPT”。输入主题或内容,输出每页 PNG,再合成一个每页都是全幅图片的 PPTX。它强调高信息密度、复杂排版、统一风格,而且明确要求必须调用图像生成模型,不能用 SVG、HTML、Canvas 或代码画图冒充。这是最关键的一段。它把图片格式的 PPT 或幻灯片截图,逆向还原成可编辑 PPTX。README 和技能说明里写得很清楚:背景图、整体框架图、元素图标和装饰、文字层,四层拆开处理。文字要变成真文本框,框架图和图标则作为可移动图片层放回 PPT。它是编排器。用户只给主题或内容时,它先调用前面的图片 PPT 生成技能,再调用图片转可编辑 PPTX 技能,最后同时交付图片型 PPT、可编辑 PPTX 和中间产物。是“把 AI 出图能力和 PPT 可编辑需求接起来”。这里最值得讲的,是“图片转可编辑 PPTX”为什么难。它有背景,有渐变,有卡片底色,有标题条,有连接线,有图表,有图标,有装饰,有艺术字,还有普通文本。人眼看是一张页面,PPT 里却是很多层对象叠在一起。如果只把原图当背景,再在上面叠一层文字,看起来像“可编辑”,其实是假的。你一改文字,原图里的旧文字还在,页面会出现双影。如果用 PPT 原生形状重画所有卡片和图表,又很容易失真。线条、圆角、阴影、渐变、比例,任何一点不准,整页就会从“高级感”掉回“仿制品”。所以 GordenImage2PPTX 才把流程写得很重:背景要复刻成干净背景;框架图要提取成一层;图标和装饰要单独提取;普通文字再由 GPT 视觉能力读取出来,按位置、字号、颜色、粗细写回文本框。因为它承认了一个现实:AI 做复杂设计时,最强的产物往往先是图像,不是 PPT 元素树。要让它进入真实办公流,必须再做一次“从图像到结构”的反向工程。不过,别把这个项目理解成普通用户打开网页就能用的 SaaS。README 写得很明确:仅限 Codex 使用。它依赖 GPT 的生图能力和视觉能力,也依赖技能里的脚本、清单、提示词、QA 约束一起跑。它不是一个“给人点按钮”的产品,而是一套“给 Agent 干活”的技能包。也就是说,用户并不是直接操作一个复杂软件,而是把任务交给 Codex:你用这个技能,给我生成 N 页 PPT,主题是什么,要求豪华、信息密度高、排版复杂;或者,把当前文件夹里的某张 PPT 图片,用 GordenImage2PPTX 还原成可编辑 PPT。Agent Skills 把能力做成一套可执行流程:什么时候用、怎么拆任务、哪些步骤不能偷懒、哪些输出算失败、如何记录中间产物、如何做 QA。Gorden Super PPT Skills 的价值,不只在 PPT 本身,也在它展示了一种新型软件形态:复杂办公任务,不一定非要做成一个完整 App,也可以做成 Agent 可调用的专业技能。README 里直接提醒:图片转可编辑 PPTX 比较费额度,转换 1 张图片大概消耗 Plus 订阅 5 小时额度的 10%。如果你要处理 20 页、40 页的大型报告,这不是一个可以随便狂跑的流程。背景复刻、框架提取、图标拆分、文字识别、坐标还原,任何一环偏了,最终 PPTX 都可能需要人工微调。尤其是信息密度很高、文字很多、装饰复杂的页面,难度会明显上升。第三,它更适合高价值 PPT,不适合所有日常文档。如果你只是做一个普通周报,没必要走这么重的流程。直接用模板或普通 PPT 工具更省事。但如果你做的是融资 BP、产品发布、咨询方案、课程销售页、年度汇报、行业研究报告,页面颜值和可编辑性都重要,那这条链路就有想象力。因为这类 PPT 的痛点不是“有没有第一页”,而是“能不能又好看,又能反复改”。我对这个项目的判断很简单:它还不是一键完美的办公神器,但方向非常对。这个项目把问题往前推了一步:AI 做出来的东西,能不能进入真实办公流程,被人接着改、接着交付、接着复用?如果你是内容创作者,它适合拿来做课程课件、社群分享、公开演讲材料。如果你是咨询、投研、产品、市场岗位,它适合试在高价值汇报里,尤其是先快速做出视觉方向,再还原成可编辑版本继续打磨。如果你是开发者,它更值得研究的是技能设计本身:一个复杂任务,如何被拆成可执行步骤、硬门禁、manifest、QA 和回归检查。如果你是普通办公用户,我建议先别把它当“万能 PPT 自动机”。它更像一台高性能但耗电的机器。用在关键场景,值;用来做所有小活,可能不划算。AI PPT 的下一阶段,不是让模型多吐几个模板。而是让模型生成的复杂视觉,真的能回到可编辑、可复用、可交付的工作流里。Gorden Super PPT Skills 做的,就是这件事。https://github.com/GordenSun/GordenSuperPPTSkills不适合谁
适合谁
- 经常做高价值 PPT 的内容、咨询、产品、市场、投研人群。
- 想把 AI PPT 从“好看截图”推进到“可编辑交付件”的团队。
- 正在研究 Agent Skills、AI 办公自动化、复杂任务编排的开发者。
- 愿意用更重的流程换更强视觉效果和后期可编辑空间的人。
坑和注意点
- 不要只看效果图,要看最终 PPTX 是否真的能编辑。
- 长 PPT 会消耗更多额度,先拿 1 到 3 页测试质量和成本。
- 项目没有在 GitHub 仓库信息里显示开源许可证,商用或二次分发前要先确认授权边界。
我怎么看
这个项目最有价值的地方,不是喊“AI PPT 终结者”。真正值得关注的是它把 PPT 生产拆成了两段:先把模型最擅长的视觉生成用足,再把真实办公最需要的可编辑能力补回来。这比单纯做一个 PPT 生成器更接近未来的办公自动化。未来很多 Agent 工具都会这样长出来:不是一个大而全的软件,而是一组能被 Agent 严格执行的专业技能。Gorden Super PPT Skills 刚好把这个趋势放在了 PPT 这个高频场景里。收藏版清单
- 项目名:Gorden Super PPT Skills
- 仓库:GordenSun/GordenSuperPPTSkills
- GitHub:https://github.com/GordenSun/GordenSuperPPTSkills
- 核心能力:生成图片 PPT,再还原成可编辑 PPTX
- 三个技能:GordenImagePPTGen、GordenImage2PPTX、GordenSuperPPTSkill
- 使用前提:README 标注仅限 Codex 使用
- 重要边界:图片转可编辑 PPTX 费额度,复杂页面需要 QA 和微调
下一步建议
先拿一个真实业务主题做 3 页:封面、核心框架页、结论页。