create-ppt Skill拆解:为什么这个PPT生成技能能一键生成专业幻灯片?(上)
你有没有遇到过这种情况哈——领导突然让你做个PPT,明天就要交。你对着空白幻灯片发呆,不知道从哪儿下手,好不容易憋出几页,风格乱七八糟,领导看了直摇头。
我之前也是这样的,直到我研究了这个 create-ppt Skill。哎,你别说,这里面的提示词设计还真有点东西。今天咱就来扒一扒,看看它是怎么做到让AI乖乖生成专业PPT的。
▶Part 1:这个Skill是干啥的?
先简单介绍一下哈。create-ppt 是一个专门生成PPT的AI技能,你告诉它要做什么主题、几页、什么风格,它就能给你整出一套完整的幻灯片。
它的核心思路挺有意思的——不是直接生成PPT文件,而是先生成一组图片,每一页就是一张图。这就好比你请了个设计师,每页给你画一张图,最后拼成一套PPT。
这种设计有几个好处: - 规避了PPT格式的复杂性 - 图片生成质量有保障 - 跨平台兼容性好
但是!这个方案的难点在于——怎么让AI生成的图片符合PPT的排版规范?
这就是提示词设计的活了。咱接着往下看。
▶Part 2:逐句拆解提示词设计
2.1 Prompt的整体结构
先看最核心的内容页prompt长啥样:
生成一张信息图海报。
视觉风格(以下内容仅用于指导风格,不要把文字本身写进画面):[从Reference获取对应风格]
[画面描述]
这个结构看起来简单,但其实暗藏玄机。让我逐句拆解:
第一行:「生成一张信息图海报。」
这是给生图模型的核心指令。很多人写prompt喜欢写一大段,其实没用。模型需要的第一信息是:你到底要我生成什么东西?
这里用的是「信息图海报」而不是「PPT」,是有讲究的。因为生图模型对「海报」这个概念理解得更准确,而「PPT」太抽象了。
第二行:「视觉风格(以下内容仅用于指导风格,不要把文字本身写进画面):」
这句话拆开看:
- 1.「视觉风格」 - 明确这是风格描述,不是内容描述
- 2.「以下内容仅用于指导风格,不要把文字本身写进画面」 - 这是个关键约束!它的意思是:后面的风格描述只是告诉你「应该是什么感觉」,但模型不要把风格描述的文字本身渲染出来。
这就好比你跟厨师说「我要川菜风格」,不是让你把「川菜」两个字写在菜里。
第三行:「从Reference获取对应风格」
这里的Reference是一系列风格指南文件,包含: - style_A_infographic.md - 信息图风 - style_B_illustration.md - 插画科普风 - style_C_photo.md - 图文混排风 - style_D_cartoon.md - 卡通绘本风 - style_E_handdrawn.md - 手绘笔记风
每个风格下面又有多个子风格,比如信息图风就包含:通用蓝白、党政红金、政务蓝、文化古典、米白暖色等等。
为什么搞得这么复杂?
因为PPT的场景太多了!给领导汇报要用「政务蓝」,党建活动要用「党政红金」,互联网公司要用「米白暖色」。如果只有一个通用风格,根本满足不了实际需求。
2.2 风格选择的三维定位逻辑
这是我认为设计得最精妙的部分。Skill里有个「风格识别规则」,按顺序判断,命中即停:
1. 受众是幼儿(3-6岁) / 幼儿园 → D.卡通绘本风
2. 纯照片展示类 → C.图文混排风
3. 受众是小学生 → B.插画科普风
4. 传播导向(知识分享/生活常识)→ E.手绘笔记风
5. 汇报导向及其他场景 → A.信息图风(默认)
这个设计背后的心理学原理是什么?
其实是一个「认知匹配」的问题。不同受众对视觉风格有不同预期: - 小朋友喜欢卡通 → 用D风格 - 摄影作品需要真实感 → 用C风格 - 打工人需要信息密度 → 用A风格
但问题是:用户往往不知道自己该选什么风格!
这个规则就相当于一个智能推荐系统——你告诉AI你的场景(受众是谁、是什么类型的内容),AI自动帮你匹配最合适的风格。
这就叫「用户说什么就做什么」,而不是「用户说用信息图风你就用信息图风」。
2.3 禁词表机制
这是另一个精妙的设计。Skill里有明确的规定:
严禁以下词汇(会导致生图模型输出人像):
商务、现代、专业、商业、咨询、高端、大气、童趣、稳重、政务、正式、规范
哎,你说奇怪不奇怪?我生成PPT,又不是生成真人照片,这些词有什么问题呢?
问题在于生图模型的偏见训练。
现在的AI生图模型大多是用真实照片训练的。当你输入「商务风格PPT」这种词时,模型很可能会生成一个人穿着西装的照片,因为它认为「商务」就应该有人。
这对于PPT来说是灾难性的——你明明要的是数据图表,结果给你来了一张商务人士的照片。
解决方案是什么?
Skill的设计是:用具体视觉描述替代抽象风格词。
比如说: - ❌「商务风格」→ ✅「白色工程图纸感的背景,浅蓝色调」 - ❌「专业感」→ ✅「线性扁平风格,几何色块承载文字」 - ❌「高端大气」→ ✅「极简几何线条装饰,留白充足」
这样模型就不会被抽象词汇误导了。
▶下篇预告
好了,上篇就先讲到这里。Part 1和Part 2的前半部分涵盖了create-ppt的核心设计思路,包括Prompt的基本结构、风格三维定位逻辑,以及禁词表机制。
下篇我会继续拆解Part 2的后半部分——融合式写法和模板复刻模式,这两个技巧才是这个Skill最值钱的地方。然后还有实战案例对比,看看普通人写的prompt和用这个Skill设计的prompt差距有多大。最后是踩坑经验和最佳实践,帮你避坑。
下篇更精彩,敬请期待! 👇
往期拆解回顾: - feishu-doc拆解:飞书文档操作的提示词设计 - xiaohongshu-creator拆解:小红书文案生成技巧
有问题欢迎留言,我会挑有意思的回答~