大多数人用AI做PPT的方式,本质上是在给AI当提词器——你输入主题,它输出垃圾,你反复修改,最后还不如自己从头做。问题不在AI,在于你的工作流从一开始就是错的。
第一层真相:市面AI PPT工具为什么总让你失望?
打开任何一个AI PPT工具,流程几乎一模一样:
1. 输入一个主题
2. 等几秒钟
3. 得到一个"看起来像PPT"的东西
然后呢?然后你就开始痛苦了。
内容空洞?改。排版丑?改。逻辑不通?还是改。改到最后你会发现——花的时间比自己从零做还多。
这不是你的错。是这些工具的设计思路从根本上就错了。
它们把PPT当成一个"模板填充问题":给你一个好看的外壳,往里面塞内容。但任何做过真正重要PPT的人都知道——PPT的灵魂从来不是模板,是思考过程。
想想看,那些让你印象深刻的PPT——乔布斯的苹果发布会、顶级咨询公司的提案、TED演讲者的幻灯片——它们的共同点是什么?不是动画炫酷,不是配色高级。而是每一页都在讲一个经过深思熟虑的观点。
而这些观点的形成,需要的是:调研、梳理、推敲、推翻重来。
AI PPT工具跳过了所有这些步骤,直接给了你结果。这就像没学走就想跑。
国内顶尖的PPT设计公司锐普,报价是1万+元/页。
他们不是贵在"做得好看"。而是贵在有一整套你从未注意过的工作流:
他们有一个专门的岗位,叫"策划师"
没错,在设计师动工之前,有一个专职人员负责:
1. 需求调研:为谁做?做什么?达到什么目的?
2. 资料搜集:找数据、找案例、找竞品信息
3. 大纲规划:用金字塔原理搭建逻辑骨架
4. 策划稿输出:每页放什么、什么位置、什么版式,全部固定好
设计师拿到手的时候,只需要负责"美化",不需要负责"思考"。
这就是为什么他们又快又好——因为思考和执行被拆成了两个独立的阶段。
三顿(一位做了7年PPT、3年AI产品的实践者)把这个流程搬到了AI上
他的PPT Agent跑的是这样一条链路:
TEXT
需求调研 → 资料搜集 → 大纲策划 → SVG策划稿(可编辑) → Image 2设计稿(终稿)
注意那个中间环节——SVG策划稿。
这是整个流程最聪明的一步。GPT-Image 2 生成的图片虽然好看,但完全不可编辑。错一个字?重来。想调顺序?重来。
所以三顿的做法是:先让AI生成一版完全可编辑的SVG初稿,确认内容和布局都没问题了,再扔给Image 2:"照着这个样子给我美化。"
这就是"策划师+设计师"分工模式的AI版本。
第三层真相:为什么"Bento Grid"是AI做PPT的最优解?
现在我们聊点更深层的——什么样的设计语言,AI最容易掌握?
答案是:卡片式布局(Bento Grid)。
这个名字来源于日式便当盒——一个个独立的小格子,组合在一起就是一个完整的画面。苹果发布会的幻灯片大量使用这种风格。
但Bento Grid不只是一个"好看的设计趋势"。它有三个特性,让它成为AI生成PPT的最优解:
第一,能装。 一页里可以清晰承载大量信息而不显拥挤。每个卡片是一个独立的信息容器。
第二,灵活。 卡片数量不固定(1个到5个甚至更多),大小可以任意组合。同样的内容可以用完全不同的版式呈现。
第三,也是最重要的——AI能懂。 这一点太关键了。"卡片"是一个结构化概念:有边界、有尺寸、有层级关系。当你告诉AI"把最重要的信息放在最大的卡片里"时,它能精确理解并执行。
相比之下,"自由排版""创意布局"这种模糊指令,AI执行起来就五花八门了。
Bento Grid 的7种标准布局
规则很简单:卡片间距 ≥ 20px,用尺寸建立视觉层级,内容由需求驱动而非模板驱动。
理解了上面这些,你用AI做PPT的方式应该彻底改变。
❌ 错误方式:提词器模式
你是AI的提词器——不断给它反馈,帮它修补漏洞。累且效果差。
✅ 正确方式:导演模式
你是导演——AI是你的编剧、美工、道具师。你把控方向,它负责执行。
假设你要做一份"2026年AI编程助手市场分析"PPT。
提词器模式:输入主题 → 得到8页泛泛而谈的内容 → 逐页修改 → 花2小时做出平庸之作。
导演模式:
1. 需求调研:听众是投资委员会,目标是论证这是一个值得投入的赛道 → 明确需要突出市场规模、增长速度、竞争格局
2. 大纲规划:金字塔原理 → 结论先行"AI编程助手是2026年最大机会之一" → 分解为市场现状/技术演进/竞争格局/投资建议
3. 资料检索:Cursor营收数据、Claude Code用户增长、OpenClaw生态规模 → 填充真实数字
4. SVG策划稿:封面用英雄式布局(大标题+4个关键数据卡片),市场现状用非对称2:1(主图表+辅助文字),竞争格局用三栏对比
5. Image 2终稿:照着策划稿渲染 → 专业级视觉效果
同样的一份PPT,两种方式的差距不是"好一点"和"差一点",而是"像专业人士做的"和"像学生做的"。
| | |
|---|
| | |
| | |
| | |
| Gemini 3 Flash / Claude Code | |
| | |
2026年,AI做PPT的能力已经远超大多数人的想象。
但工具越强,对使用者的要求越高——不是因为操作变复杂了,而是因为你需要知道什么时候该用什么工具、按什么顺序用。
那些还在"输入主题→等结果→不满意→重来"循环的人,会被那些掌握了正确工作流的人远远甩在后面。
差别不在AI模型,在工作流。
如果你觉得这篇文章有价值,转发给你的团队。下次做PPT之前,先花10分钟想清楚——你要当提词器,还是当导演?