当前位置：首页>PPT>create-ppt拆解:为什么这个AI能一键生成专业PPT?(

create-ppt拆解:为什么这个AI能一键生成专业PPT?(

2026-05-17 02:58:42

create-ppt Skill拆解：为什么这个PPT生成技能能一键生成专业幻灯片？（上）

你有没有遇到过这种情况哈——领导突然让你做个PPT，明天就要交。你对着空白幻灯片发呆，不知道从哪儿下手，好不容易憋出几页，风格乱七八糟，领导看了直摇头。

我之前也是这样的，直到我研究了这个 create-ppt Skill。哎，你别说，这里面的提示词设计还真有点东西。今天咱就来扒一扒，看看它是怎么做到让AI乖乖生成专业PPT的。

▶Part 1：这个Skill是干啥的？

先简单介绍一下哈。create-ppt 是一个专门生成PPT的AI技能，你告诉它要做什么主题、几页、什么风格，它就能给你整出一套完整的幻灯片。

它的核心思路挺有意思的——不是直接生成PPT文件，而是先生成一组图片，每一页就是一张图。这就好比你请了个设计师，每页给你画一张图，最后拼成一套PPT。

这种设计有几个好处： - 规避了PPT格式的复杂性 - 图片生成质量有保障 - 跨平台兼容性好

但是！这个方案的难点在于——怎么让AI生成的图片符合PPT的排版规范？

这就是提示词设计的活了。咱接着往下看。

▶Part 2：逐句拆解提示词设计

2.1 Prompt的整体结构

先看最核心的内容页prompt长啥样：

生成一张信息图海报。视觉风格（以下内容仅用于指导风格，不要把文字本身写进画面）：[从Reference获取对应风格] [画面描述]

这个结构看起来简单，但其实暗藏玄机。让我逐句拆解：

第一行：「生成一张信息图海报。」

这是给生图模型的核心指令。很多人写prompt喜欢写一大段，其实没用。模型需要的第一信息是：你到底要我生成什么东西？

这里用的是「信息图海报」而不是「PPT」，是有讲究的。因为生图模型对「海报」这个概念理解得更准确，而「PPT」太抽象了。

第二行：「视觉风格（以下内容仅用于指导风格，不要把文字本身写进画面）：」

这句话拆开看：

1.「视觉风格」 - 明确这是风格描述，不是内容描述
2.「以下内容仅用于指导风格，不要把文字本身写进画面」 - 这是个关键约束！它的意思是：后面的风格描述只是告诉你「应该是什么感觉」，但模型不要把风格描述的文字本身渲染出来。

这就好比你跟厨师说「我要川菜风格」，不是让你把「川菜」两个字写在菜里。

第三行：「从Reference获取对应风格」

这里的Reference是一系列风格指南文件，包含： - style_A_infographic.md - 信息图风 - style_B_illustration.md - 插画科普风 - style_C_photo.md - 图文混排风 - style_D_cartoon.md - 卡通绘本风 - style_E_handdrawn.md - 手绘笔记风

每个风格下面又有多个子风格，比如信息图风就包含：通用蓝白、党政红金、政务蓝、文化古典、米白暖色等等。

为什么搞得这么复杂？

因为PPT的场景太多了！给领导汇报要用「政务蓝」，党建活动要用「党政红金」，互联网公司要用「米白暖色」。如果只有一个通用风格，根本满足不了实际需求。

2.2 风格选择的三维定位逻辑

这是我认为设计得最精妙的部分。Skill里有个「风格识别规则」，按顺序判断，命中即停：

1. 受众是幼儿(3-6岁) / 幼儿园 → D.卡通绘本风 2. 纯照片展示类 → C.图文混排风 3. 受众是小学生 → B.插画科普风 4. 传播导向（知识分享/生活常识）→ E.手绘笔记风 5. 汇报导向及其他场景 → A.信息图风（默认）

这个设计背后的心理学原理是什么？

其实是一个「认知匹配」的问题。不同受众对视觉风格有不同预期： - 小朋友喜欢卡通 → 用D风格 - 摄影作品需要真实感 → 用C风格 - 打工人需要信息密度 → 用A风格

但问题是：用户往往不知道自己该选什么风格！

这个规则就相当于一个智能推荐系统——你告诉AI你的场景（受众是谁、是什么类型的内容），AI自动帮你匹配最合适的风格。

这就叫「用户说什么就做什么」，而不是「用户说用信息图风你就用信息图风」。

2.3 禁词表机制

这是另一个精妙的设计。Skill里有明确的规定：

严禁以下词汇（会导致生图模型输出人像）：

商务、现代、专业、商业、咨询、高端、大气、童趣、稳重、政务、正式、规范

哎，你说奇怪不奇怪？我生成PPT，又不是生成真人照片，这些词有什么问题呢？

问题在于生图模型的偏见训练。

现在的AI生图模型大多是用真实照片训练的。当你输入「商务风格PPT」这种词时，模型很可能会生成一个人穿着西装的照片，因为它认为「商务」就应该有人。

这对于PPT来说是灾难性的——你明明要的是数据图表，结果给你来了一张商务人士的照片。

解决方案是什么？

Skill的设计是：用具体视觉描述替代抽象风格词。

比如说： - ❌「商务风格」→ ✅「白色工程图纸感的背景，浅蓝色调」 - ❌「专业感」→ ✅「线性扁平风格，几何色块承载文字」 - ❌「高端大气」→ ✅「极简几何线条装饰，留白充足」

这样模型就不会被抽象词汇误导了。

▶下篇预告

好了，上篇就先讲到这里。Part 1和Part 2的前半部分涵盖了create-ppt的核心设计思路，包括Prompt的基本结构、风格三维定位逻辑，以及禁词表机制。

下篇我会继续拆解Part 2的后半部分——融合式写法和模板复刻模式，这两个技巧才是这个Skill最值钱的地方。然后还有实战案例对比，看看普通人写的prompt和用这个Skill设计的prompt差距有多大。最后是踩坑经验和最佳实践，帮你避坑。

下篇更精彩，敬请期待！ 👇

往期拆解回顾： - feishu-doc拆解：飞书文档操作的提示词设计 - xiaohongshu-creator拆解：小红书文案生成技巧

有问题欢迎留言，我会挑有意思的回答~

本文来自网友投稿或网络内容，如有侵犯您的权益请联系我们删除，联系邮箱：wyl860211@qq.com 。

create-ppt拆解:为什么这个AI能一键生成专业PPT?(

create-ppt Skill拆解：为什么这个PPT生成技能能一键生成专业幻灯片？（上）

▶Part 1：这个Skill是干啥的？

▶Part 2：逐句拆解提示词设计

2.1 Prompt的整体结构

2.2 风格选择的三维定位逻辑

2.3 禁词表机制

▶下篇预告

最新文章

热门文章

随机文章

create-ppt拆解:为什么这个AI能一键生成专业PPT?(

create-ppt Skill拆解：为什么这个PPT生成技能能一键生成专业幻灯片？（上）

▶Part 1：这个Skill是干啥的？

▶Part 2：逐句拆解提示词设计

2.1 Prompt的整体结构

2.2 风格选择的三维定位逻辑

2.3 禁词表机制

▶下篇预告

2026职业病培训课件ppt

老年人误吸的预防专家共识PPT分享|49页

最新文章

热门文章

随机文章