当前位置：首页>PPT>别再做“死 PPT”了,这个 GitHub 项目想把 AI 生成的豪华 PPT 变成可编辑文件

别再做“死 PPT”了,这个 GitHub 项目想把 AI 生成的豪华 PPT 变成可编辑文件

2026-06-27 15:28:35

阅读全文预计耗时 8 分钟。

几秒钟速读版

这篇讲什么：

一个叫 Gorden Super PPT Skills 的 GitHub 项目，试图解决 AI PPT 最烦人的问题：图很好看，但不能真正编辑。

为什么要看：

现在很多 AI 做 PPT，第一眼很炫，第二眼就尴尬。你想改一个字、挪一个图标、换一个模块，发现它本质上只是一张图。这个项目的思路是：先用 GPT 生成高质量图片 PPT，再把图片拆成背景、框架、图标、文本四层，重新拼成可编辑 PPTX。

你能记住什么：

仓库地址：
https://github.com/GordenSun/GordenSuperPPTSkills
它不是 PPT 模板库，而是一套给 Codex 用的 Agent Skills。
核心链路分成 3 个技能：GordenImagePPTGen、GordenImage2PPTX、GordenSuperPPTSkill。
亮点不是“AI 能出图”，而是“图片 PPT 能能不能还原成可编辑 PPTX”。
它很强，但不轻。README 明确写到，图片转可编辑 PPTX 比较费额度，1 张图大概消耗 Plus 订阅 5 小时额度的 10%。

适合谁：

经常做商业计划书、课程课件、项目汇报、产品方案、咨询报告的人；也适合研究 Agent Skills、AI 办公自动化、PPT 生产链路的开发者。

完整正文版

很多人用 AI 做 PPT，卡住的地方不是“能不能生成”。

现在的模型已经很会做漂亮页面了。大标题、渐变背景、复杂卡片、图表、科技感装饰，一次出图就能让人觉得“这页挺像样”。

真正麻烦的是下一步。

客户说，第三页左下角那句话换一下。

领导说，把这个模块移到右边。

你自己发现，一个图标不对，一个数字要改，一个标题太长。

然后问题来了：这份所谓的 PPT，其实是一张图。

好看，但改不了。

Gorden Super PPT Skills 盯上的就是这个缝隙。

它的野心不是再做一个“AI 帮你生成 PPT”的玩具，而是把 AI PPT 生产拆成一条更完整的链路：先生成豪华图片版 PPT，再把图片 PPT 拆层还原，最后输出可编辑的 PPTX。

这才是它值得传播的地方。

仓库现在的定位很直接：AI PPT 赛道终结者。

这句话很猛，我不会照单全收。因为真正到生产环境里，PPT 的质量、可控性、成本、稳定性都要看实际任务。

但这个项目确实抓住了一个关键矛盾：AI 生成的“视觉完成度”和人工后期的“编辑自由度”，长期是冲突的。

普通 AI PPT 工具通常走两条路。

第一条路，生成可编辑 PPT。好处是能改，坏处是经常设计感一般，像套模板。

第二条路，生成整页图片。好处是好看，坏处是不可编辑，后期只能重做或硬抠。

Gorden Super PPT Skills 的思路，是先接受“图片生成模型更擅长复杂视觉设计”这个现实，然后再用视觉解析和分层重建，把图片拆回 PPTX 结构。

这不是一步到位的魔法，更像一条工程流水线。

它把整件事拆成三个技能。

第一个，GordenImagePPTGen。

它负责生成“图片格式的 PPT”。输入主题或内容，输出每页 PNG，再合成一个每页都是全幅图片的 PPTX。它强调高信息密度、复杂排版、统一风格，而且明确要求必须调用图像生成模型，不能用 SVG、HTML、Canvas 或代码画图冒充。

第二个，GordenImage2PPTX。

这是最关键的一段。它把图片格式的 PPT 或幻灯片截图，逆向还原成可编辑 PPTX。README 和技能说明里写得很清楚：背景图、整体框架图、元素图标和装饰、文字层，四层拆开处理。文字要变成真文本框，框架图和图标则作为可移动图片层放回 PPT。

第三个，GordenSuperPPTSkill。

它是编排器。用户只给主题或内容时，它先调用前面的图片 PPT 生成技能，再调用图片转可编辑 PPTX 技能，最后同时交付图片型 PPT、可编辑 PPTX 和中间产物。

这就是这个项目的完整故事。

不是“做 PPT”。

是“把 AI 出图能力和 PPT 可编辑需求接起来”。

这里最值得讲的，是“图片转可编辑 PPTX”为什么难。

一页 PPT 不是只有文字。

它有背景，有渐变，有卡片底色，有标题条，有连接线，有图表，有图标，有装饰，有艺术字，还有普通文本。人眼看是一张页面，PPT 里却是很多层对象叠在一起。

如果只把原图当背景，再在上面叠一层文字，看起来像“可编辑”，其实是假的。你一改文字，原图里的旧文字还在，页面会出现双影。

如果用 PPT 原生形状重画所有卡片和图表，又很容易失真。线条、圆角、阴影、渐变、比例，任何一点不准，整页就会从“高级感”掉回“仿制品”。

所以 GordenImage2PPTX 才把流程写得很重：背景要复刻成干净背景；框架图要提取成一层；图标和装饰要单独提取；普通文字再由 GPT 视觉能力读取出来，按位置、字号、颜色、粗细写回文本框。

这套方法不轻，但逻辑是对的。

因为它承认了一个现实：AI 做复杂设计时，最强的产物往往先是图像，不是 PPT 元素树。

要让它进入真实办公流，必须再做一次“从图像到结构”的反向工程。

不过，别把这个项目理解成普通用户打开网页就能用的 SaaS。

README 写得很明确：仅限 Codex 使用。它依赖 GPT 的生图能力和视觉能力，也依赖技能里的脚本、清单、提示词、QA 约束一起跑。

这点反而很有意思。

它不是一个“给人点按钮”的产品，而是一套“给 Agent 干活”的技能包。

也就是说，用户并不是直接操作一个复杂软件，而是把任务交给 Codex：你用这个技能，给我生成 N 页 PPT，主题是什么，要求豪华、信息密度高、排版复杂；或者，把当前文件夹里的某张 PPT 图片，用 GordenImage2PPTX 还原成可编辑 PPT。

这跟传统办公软件的逻辑不一样。

传统软件把能力做成菜单和按钮。

Agent Skills 把能力做成一套可执行流程：什么时候用、怎么拆任务、哪些步骤不能偷懒、哪些输出算失败、如何记录中间产物、如何做 QA。

Gorden Super PPT Skills 的价值，不只在 PPT 本身，也在它展示了一种新型软件形态：复杂办公任务，不一定非要做成一个完整 App，也可以做成 Agent 可调用的专业技能。

当然，它也有边界。

第一，成本不低。

README 里直接提醒：图片转可编辑 PPTX 比较费额度，转换 1 张图片大概消耗 Plus 订阅 5 小时额度的 10%。如果你要处理 20 页、40 页的大型报告，这不是一个可以随便狂跑的流程。

第二，质量依赖模型能力。

背景复刻、框架提取、图标拆分、文字识别、坐标还原，任何一环偏了，最终 PPTX 都可能需要人工微调。尤其是信息密度很高、文字很多、装饰复杂的页面，难度会明显上升。

第三，它更适合高价值 PPT，不适合所有日常文档。

如果你只是做一个普通周报，没必要走这么重的流程。直接用模板或普通 PPT 工具更省事。

但如果你做的是融资 BP、产品发布、咨询方案、课程销售页、年度汇报、行业研究报告，页面颜值和可编辑性都重要，那这条链路就有想象力。

因为这类 PPT 的痛点不是“有没有第一页”，而是“能不能又好看，又能反复改”。

我对这个项目的判断很简单：它还不是一键完美的办公神器，但方向非常对。

过去我们习惯问：AI 能不能替我做 PPT？

这个项目把问题往前推了一步：AI 做出来的东西，能不能进入真实办公流程，被人接着改、接着交付、接着复用？

这个问题比“生成得漂不漂亮”重要得多。

如果你是内容创作者，它适合拿来做课程课件、社群分享、公开演讲材料。

如果你是咨询、投研、产品、市场岗位，它适合试在高价值汇报里，尤其是先快速做出视觉方向，再还原成可编辑版本继续打磨。

如果你是开发者，它更值得研究的是技能设计本身：一个复杂任务，如何被拆成可执行步骤、硬门禁、manifest、QA 和回归检查。

如果你是普通办公用户，我建议先别把它当“万能 PPT 自动机”。

它更像一台高性能但耗电的机器。用在关键场景，值；用来做所有小活，可能不划算。

最后给一个更直白的结论。

AI PPT 的下一阶段，不是让模型多吐几个模板。

而是让模型生成的复杂视觉，真的能回到可编辑、可复用、可交付的工作流里。

Gorden Super PPT Skills 做的，就是这件事。

仓库地址：

https://github.com/GordenSun/GordenSuperPPTSkills

不适合谁

只想找现成 PPT 模板的人。
没有 Codex/GPT 生图与视觉环境的人。
对额度消耗非常敏感、只做低价值日常文档的人。
想要完全零人工检查、零后期微调的人。

适合谁

经常做高价值 PPT 的内容、咨询、产品、市场、投研人群。
想把 AI PPT 从“好看截图”推进到“可编辑交付件”的团队。
正在研究 Agent Skills、AI 办公自动化、复杂任务编排的开发者。
愿意用更重的流程换更强视觉效果和后期可编辑空间的人。

坑和注意点

不要只看效果图，要看最终 PPTX 是否真的能编辑。
长 PPT 会消耗更多额度，先拿 1 到 3 页测试质量和成本。
高密度页面更容易出现文字、图标、坐标还原误差。
它目前更像专业技能包，不是面向小白的傻瓜软件。
项目没有在 GitHub 仓库信息里显示开源许可证，商用或二次分发前要先确认授权边界。

我怎么看

这个项目最有价值的地方，不是喊“AI PPT 终结者”。

真正值得关注的是它把 PPT 生产拆成了两段：先把模型最擅长的视觉生成用足，再把真实办公最需要的可编辑能力补回来。

这比单纯做一个 PPT 生成器更接近未来的办公自动化。

未来很多 Agent 工具都会这样长出来：不是一个大而全的软件，而是一组能被 Agent 严格执行的专业技能。

Gorden Super PPT Skills 刚好把这个趋势放在了 PPT 这个高频场景里。

收藏版清单

项目名：Gorden Super PPT Skills
仓库：GordenSun/GordenSuperPPTSkills
GitHub：https://github.com/GordenSun/GordenSuperPPTSkills
当前主语言：Python
核心能力：生成图片 PPT，再还原成可编辑 PPTX
三个技能：GordenImagePPTGen、GordenImage2PPTX、GordenSuperPPTSkill
关键机制：背景、框架、图标/装饰、文字四层重建
使用前提：README 标注仅限 Codex 使用
重要边界：图片转可编辑 PPTX 费额度，复杂页面需要 QA 和微调

下一步建议

如果你想试，别一上来做 30 页。

先拿一个真实业务主题做 3 页：封面、核心框架页、结论页。

看三件事。

第一，图片版 PPT 是否真的比普通模板强。

第二，转出来的 PPTX 能不能满足后期编辑。

第三，消耗的额度和时间，是否值得用在你的场景里。

这三个问题跑通了，再考虑把它放进长期工作流。

本文来自网友投稿或网络内容，如有侵犯您的权益请联系我们删除，联系邮箱：wyl860211@qq.com 。

别再做“死 PPT”了,这个 GitHub 项目想把 AI 生成的豪华 PPT 变成可编辑文件

几秒钟速读版

这篇讲什么：

为什么要看：

你能记住什么：

适合谁：

完整正文版

不适合谁

适合谁

坑和注意点

我怎么看

收藏版清单

下一步建议

最新文章

热门文章

随机文章

别再做“死 PPT”了,这个 GitHub 项目想把 AI 生成的豪华 PPT 变成可编辑文件

几秒钟速读版

这篇讲什么：

为什么要看：

你能记住什么：

适合谁：

完整正文版

不适合谁

适合谁

坑和注意点

我怎么看

收藏版清单

下一步建议

第五届PPT技能大赛圆满结束

财会人绝不认输的49个Excel函数保命指南

最新文章

热门文章

随机文章