先放一张图,这是用 AI 做出来的PPT。
说实话,已经快追上那种古法手搓的效果了。
但我想聊的不是这张图本身,而是背后的这套流程。因为用AI做PPT这事儿,我折腾了不下几十次,踩过的坑实在太多。
老问题:AI做PPT,一做就散
用AI做过PPT的人应该都有体会:
一口气让AI生成整套PPT,每一页都风格各异。想改一页?对不起,整套重来。演讲备注还得自己另外写一遍。
逻辑散、风格飘、交付难,这三个毛病基本是通病。
GPT Image 2 出来之后,单张图的质量上了一个台阶。但真正拉开差距的,不是单张图能生多好看,而是——能不能把PPT做成一条稳定的流水线。
我现在的做法:拆成 10 步
我不再让AI一次性生成整套 PPT。而是把整个过程拆开,每一步都留下可以检查、可以改的中间产物。
核心就一句话:先把内容变成结构化大纲,再把每页变成可复现的 prompt,批量出图之后合成 PPTX,顺便把演讲备注写进去。
第一,分析内容。
你给它主题、Word、参考 PPT、品牌图都行。它先判断这是销售材料还是技术材料、面向什么人、适合多少页、什么风格。结果写进 analysis.md,不直接开画。
第二,确认制作方向
风格、受众、页数、是否审核大纲、是否审核 prompt,做之前这五件事先定清楚。方向错了,后面再精美都是白费。
第三,生成大纲
outline.md 里的每一页不是只有标题,而是包含页面类型、叙事目标、关键内容、视觉方案、版式建议。相当于整套 PPT 的剧本。
第四,检查一下大纲
这一步特别值得花时间。删掉重复页、调整顺序、补上缺失的环节,都在这一步做。先改逻辑,再生图,效率最高。
第五,每页都设计独立的prompt
这个设计我觉得是整套流程最值钱的地方。每页一个 prompt 文件,后面哪页不满意,单独改那一页就行,不用全套重来。
prompts/01-slide-cover.md
prompts/02-slide-market-window.md
prompts/03-slide-pain-points.md
...
第六,批量出图
主通道走 GPT Image 2,某一页连续失败 3 次才会 fallback 到备用接口。
第七,自动写备注
speaker-notes.md 写的不是图片的描述,而是真正能拿来讲的话——这一页讲什么、关键价值是什么、怎么过渡到下一页,长度也控制在口播能用的范围。
第八,合成 PPTX
图片按顺序铺满每一页,备注自动写进 PowerPoint 的备注区。交付的是一个真正能用的 .pptx,不是一堆散图。
最爽的是:单页迭代,后期改稿的体验完全不一样了:
某页画面不对?改对应 prompt,单独重生那一页
某页话术别扭?改 speaker-notes.md
要加一页?新增 prompt,出图,更新大纲和备注
要删一页?删掉,重新编号,合成
这才是 AI 做 PPT 应该有的样子。

工作流真正的价值:全程可控
我现在越来越觉得,AI 生成内容最大的坑不是质量,是过程不可追踪。一口气生成出来,好也好了,坏也认了,没法改。
这套流程反过来——把所有中间过程都显式化。
逻辑有 outline,视觉有 prompt,结果有单张图,备注有稿子,迭代能单页重来,最后能交付 PPTX。每一步都看得见、改得动。
另外,别追求一次成片。真正高效的节奏是:
先把大纲做对 → 把 prompt 调稳 → 批量生成第一版 → 挑 2 到 3 页重点打磨 → 最后合成。
PPT 的质量顺序永远是:结构 > 视觉 > 局部细节。
最后
GPT Image 2 之后,AI 做 PPT 的上限被抬高了一大截。但能不能稳定交付,拼的不是单次生成,是工程化。
以后评估一个 AI PPT 工具,别只问它"能不能生成"。要问它:
能不能重来、能不能单页改、能不能写备注、能不能最终给我一个 .pptx。
关注后私信发送 ppt,可以拿到基于 GPT-Image-2 的这套完整skill