网上有很多说做PPT的方法,skill、agent等各种样式的,但是针对大多数来说都是看完了,知道了,但是做起来还是和原来没有什么区别,本文将做AI做PPT的方法一步一步演示给你看, 只需要按照本文的操作步骤实践一遍,你也能做出精美的PPT——PPT方法论和实践论。
这篇内容,我想用一个真实的案例(一页"滕王阁"主题的 PPT)带你走完全程,把用AI做PPT的全流程讲清楚。
先看按照文章做成成品

我们先下两个定义,别嫌啰嗦,这是全文的地基。
方法论,回答的是"应该怎么做"。它是抽象的、可复用的原则。比如:"PPT 要有视觉重心""图文要有层次""留白很重要"。这些话都对,但你听完依然不会做。因为它停留在"知道"。
实践论,回答的是"具体怎么落地"。它是具体的、可执行的动作。比如:"主图占页面宽度 52%,靠左满版""标题用古铜金 #D4AF37,字号 84pt""文字区和图区之间留 80px 不放任何东西"。这些是"做到"。
一句话总结:方法论让你不迷路,实践论让你真的走到终点。
大多数人卡在中间——懂了一堆道理,却始终迈不出第一步。而 AI 时代真正的红利,恰恰是它能帮你把"方法论"快速翻译成"实践论"。
下面这四步,就是这套翻译流程。
做 PPT 最大的误区,是打开软件就开始拖文本框。
正确的顺序是:先有结构,再有内容,最后才是排版。
这一步的任务,是把脑子里模糊的想法,变成一份清晰的结构化大纲。这件事,DeepSeek 非常擅长——它逻辑性强、中文语感好、对结构化输出的把控很到位,而且响应快、成本低,特别适合做"骨架规划"这种需要反复迭代的活儿。
你可以这样给它提需求:
你是全球顶尖设计师,请生成一页介绍滕王阁的PPT大纲,如果需要实景图的请标注好实景图的位置大小以及实景图的要求描述;把这一页大纲要求做一个大纲md内容给我

DeepSeek 会还给你一份结构清晰的大纲:主视觉区怎么放、文字信息区分几块、标题用什么色、诗句放哪里……
然后点击deepsekk网页上的复制,将大纲内容复制下来,
# 滕王阁 · 单页PPT设计大纲**设计主题**:千年豫章,一阁风华**设计风格**:现代中式极简美学,强调留白与光影层次,以“落霞孤鹜”为色彩灵感**画幅比例**:16:9 宽屏 (建议尺寸 1920×1080px)**字体选择**:标题用“思源宋体 Heavy”,正文用“苹方-简 常规体”,装饰英文用“Trajan Pro”---## 一、整体布局结构页面采用 **非对称黄金分割构图**,左图右文,视觉重心稳定且富有张力。| 区域 | 位置 | 尺寸 | 功能 ||------|------|------|------|| **主视觉区** | 左侧,紧贴左边缘 | 宽度占页面总宽 52%,高度满版 (1080px) | 放置滕王阁实景图,打造沉浸式入口 || **文字信息区** | 右侧,与主图保持 80px 安全间距 | 宽度占页面总宽 42%,高度自动,垂直居中 | 承载标题、核心信息与诗句 || **装饰水印区** | 右上角及文字区背景 | 局部点缀,不超 150px 高度 | 唐代卷草纹、《滕王阁序》金句墨迹 |---## 二、核心内容分区设计### 1. 主视觉区 · 实景图需求**实景图位置**:- **水平定位**:左边缘对齐,X=0- **垂直定位**:Y=0,顶部对齐- **尺寸**:宽 998px (52%),高 1080px,全高裁切- **图层关系**:置于底层,上方叠加一层从左至右的 30%→0% 黑色渐变蒙版,保证右侧文字的可读性**实景图内容要求描述**:- **拍摄主体**:滕王阁正面偏东 15° 视角,完整展现“明三暗七”阁楼形制与高台基座,碧瓦丹柱清晰可见。- **时间与环境**:**秋季傍晚黄金时刻(日落前30分钟)**,天空呈现由暖橙向紫蓝渐变的戏剧性色彩,恰如“落霞与孤鹜齐飞”。- **光影要求**:夕阳侧光勾勒出飞檐翘角的轮廓光,阁身灯笼初亮(暖黄光),赣江水面上应有柔和的粼光倒影,远景需包含少量现代城市轮廓虚化以体现古今对话。- **画面构成**:下部保留江岸石栏或古树剪影作为前景框景,中景为滕王阁主体,远景为长天与江水交汇,层次分明。- **色调与情绪**:浓郁、典雅、史诗感,不允许出现游客或任何现代标识,干净纯粹。- **图源建议**:可参考500px或Getty Images上搜索“Tengwang Pavilion sunset”,或使用无人机专业航拍未裁切原片。### 2. 文字信息区 · 排版结构**A. 主标题组**- **中文主标**:“滕王阁”- 字号:96pt,字重:Bold,颜色:#D4AF37 (古铜金)- 字符间距:120,垂直书写,自上而下排列,位于文字区左列- **英文副标**:“The Pavilion of Prince Teng”- 字号:18pt,颜色:#888888,大写,字间距400,位于中文标题右侧底部- **装饰线**:标题下方一条 1px 金色横线,长度 60px**B. 核心信息卡片 (3块纵向排列,间距40px)**1. **地理与始建**- 图标:水墨山形符号- 文字:“豫章故郡,洪都新府 | 唐永徽四年 (公元653年) 始建”- 字号:14pt,颜色:#FFFFFF,透明度90%2. **建筑数据**- 图标:斗拱符号- 文字:“通高57.5米 | 明三暗七格式 | 九重飞檐 | 宋代法式复原”- 字号:14pt,颜色:#CCCCCC3. **文化地位**- 图标:卷轴符号- 文字:“江南三大名楼之首 | 国家5A级景区 | 《滕王阁序》诞生地”- 字号:14pt,颜色:#CCCCCC**C. 金句区 (视觉锚点)**- **主诗句**:“落霞与孤鹜齐飞,秋水共长天一色。”- 字体:行楷书法体(需单独设计或使用禹卫书法行书)- 字号:42pt,颜色:#FFFFFF,字间距:30- 位置:文字区底部,右对齐- 特效:文字添加微弱的金色外发光,模仿墨汁渗化感- **诗人落款**:“—— 王勃《滕王阁序》”- 字号:16pt,颜色:#999999,紧随诗句右下### 3. 装饰细节- **背景纹样**:文字区背景覆盖 5% 透明度的《滕王阁序》全文小篆竖排,营造博物馆级文化质感。- **页脚信息**:左下角横排小字 “JIANGXI · CHINA”,字号10pt,颜色#666,金色分隔符。- **品牌水印**:右上角放置极简重构的“滕阁秋风”朱文印章,尺寸50×50px,颜色#C00000。---## 三、视觉层次与色彩规范| 层级 | 元素 | 颜色/效果 | 说明 ||------|------|-----------|------|| 1 级 | 主视觉图 | 全彩,高饱和 | 注意力入口,定调情绪 || 2 级 | “滕王阁”竖排标题 | #D4AF37 金属金 | 第一眼识别,文化重量感 || 3 级 | 核心信息卡片 | 白色/浅灰,半透明深色底 | 快速传递关键事实 || 4 级 | 千古名句 | 书法白字+金色微光 | 情感共鸣,升华文学价值 || 背景 | 全文篆书水印 | 5%白 | 丰富细节,不干扰阅读 |**配色方案**:深空蓝黑底色 `#0A0E17` → 图区暖色渐变融入 → 金色点缀 `#D4AF37` → 白色文字分层。整体色调呼应“秋水长天”。---## 四、动态与切换建议 (如用于演示)- 此页建议作为 **全屏静止视觉锤页面**,无动效。- 在PPT中可设置此页为章节封面,配合淡入切换。- 如需微动效,仅实景图的天空部分可做极其缓慢的云层移动(需用视频素材),增强“时间凝固”感。---## 五、设计交付标注- 所有元素需对齐至8px网格系统。- 文字区与图区严格保持80px间距,此空间为留白呼吸区,不可放入任何信息。- 实景图输出格式为16位TIFF,确保印刷级细节。- 最终页面导出为PNG(网页)及PDF(印刷)。---
这一步的本质,是把"方法论"具象成"可执行的设计说明书"。你不再是面对一张空白画布发呆,而是拿到了一张施工图。
💡 小技巧:让 DeepSeek 输出时带上具体的数值和坐标(占比、字号、间距、色值),越具体,后面越省事。
有了大纲,接下来要把它变成真正的页面。这里我推荐用 Claude Opus 这一档的模型。原因很实际:
· 长文本、强逻辑、代码能力顶尖,能把一份复杂大纲一次性翻译成完整、规范的 HTML / CSS;· 对细节的还原度高,你说"标题下方一条 1px 金色横线,长度 60px",它真的会给你画出来;· 能处理复杂约束,比如"渐变蒙版保证右侧文字可读""8px 网格对齐"这种讲究,它都能照顾到。
第一:首先打开你的IDE工具;

第二:将deepseek生成的大纲内容复制到IDE的聊天框中,然后在后面输入,一定要说明要它调用skill,不然不会生成图片
根据对大纲内容的理解生成一页HTML格式的PPT,其中要生成实景图的请调用对应skill来生成实景图;
为什么用 HTML 而不是直接画 PPT?因为 HTML + CSS 是目前对 AI 最友好的"设计语言"。它精确、可控、所见即所得,AI 能用代码精准表达每一个像素的位置。这是从"大纲"到"成品"之间最关键的一跃。
在这一步,Claude 会把 DeepSeek 给的施工图,变成一页真正能在浏览器里打开、效果惊艳的网页版 PPT:左侧实景大图、右侧竖排金色标题、半透明信息卡片、底部发光的"落霞与孤鹜齐飞"……
这一步的本质,是把"设计说明书"变成"看得见的成品"。

在这里有一个非常核心的内容,请牢记,我会让IDE调用我安装的AI自动绘图skill,这个skill会自己打开你的浏览器,然后自动打开豆包,自动输入提示词,然后自动生成对应的图片,并将图片自动插入到PPT中,整个过程无需人工干预,全部自动完成。

这个是我的skill文件,如有需要请私信或者添加微信。自动过程如下:

第三:IDE生成的效果如下:

第四:用浏览器打开HTML文件查看效果。

到这里你可能会问:网页是好看,但我领导要的是 .pptx 文件,能在 PowerPoint 里改字啊?这就是第三步要解决的问题:把 HTML 转换成可编辑的 PPT 文件。
注意,关键词是"可编辑"。市面上很多工具是直接把页面"截图"贴进 PPT,结果就是一张图——你一个字都改不了。专业的转换工具不一样,它会识别页面里的每一个文字块、每一张图片、每一个图形,把它们还原成 PPT 里独立的、可编辑的元素。
不过这一步有个坑,我替你踩过了:
转换工具对结构有要求。比如它要求所有文字必须包在 <p>、<h1>~<h6>、<ul>、<ol> 这类标签里,光用 <div> 装文字,转出来会丢失;它还会校验文字框不能贴边(离边缘至少 0.5 英寸),否则报错。
在这里我会有一个标准的规则,包含了字体、格式、文字大小、间距等等所有的规范文件,也是生成PPT最重要的东西;示意如下:
inclusion: always-----------------# HTML 幻灯片设计规范面向大模型以 HTML 格式生成 PPTX 幻灯片。统一 1280×720 布局、微软雅黑字体、1.5 行距。---## 一、设计美学规范以专业咨询公司咨询专家的角度设计PPT,追求简洁、专业、信息清晰的视觉效果。### 1.1 内容原则- **主题清晰:** 每页包含明确主题、核心内容和视觉元素line-height- **信息饱满:** 内容充实有层次,避免拥挤堆砌,保持适当行高和留白- **视觉引导:** 通过布局、分隔线、箭头引导视觉焦点- **层次分明:** 通过字号、颜色、间距建立清晰的信息层级- ⚠️ **空白校验:** 页面不应出现大面积空白区域(超过 100×100px 的空白块)### 1.2 视觉元素原则⚠️ **禁止使用 Emoji图标**- **图标:** 仅在重要标题处使用(主标题、卡片标题、模块标题),优先使用 DIV+CSS 实现- **图表:** 单页最多 2 个图表区域,数据系列不超过 5 个,优先使用 DIV+CSS 实现- **渐变与 SVG:** 实现优先级 DIV+CSS → SVG,详见第四章### 1.3 配色体系以 `#185786` 为核心主色构建蓝色系,强调或特殊情况可使用绿色系或橙色系作为辅助色。| 色系 | 色值 | 用途 || ------ | -------------------------------------------------------- | ---------------------------- || 深蓝 | `#123F5A` → `#185786` → `#1F6B99` | 标题底色、主强调色、序号圆圈 || 科技蓝 | `#185786` → `#2A7FB5` → `#5AA6D6` | 主色调、边框色、强调文字 || 浅蓝 | `#93c5fd` → `#bfdbfe` → `#dbeafe` → `#eff6ff` | 模块背景、卡片背景、辅助色 || 黑灰 | `#000000` → `#374151` → `#64748b` | 正文文字、辅助文字 || 背景 | `#f0f7ff` → `#ffffff` | 页面背景、卡片背景 || 成功绿 | `#10b981` → `#34d399` | 正向指标、完成状态 || 警示橙 | `#f59e0b` → `#fbbf24` | 警告、待处理状态 |
整个规则要求较长,这里只是一部分,如需全文请私信或者添加微信。
我那页"滕王阁"就因为诗句离底边太近,连续报了好几次错,最后是把整个文字区的字号、间距压缩、整体上移,才顺利通过。
这一步的本质,是让你的作品"落地"成同事、领导能直接用的交付物。
💡 经验:做之前就让 Claude 按转换工具的规范来写代码(文字包标签、元素不贴边、按网格对齐),能省掉大量反复调试。
在这里我是通过自己开发的一个小工具来进行转换的,专业工具截图如下(如需工具请私信):
第一:选择对应的HTML文件

第二:点击开始转换进行文件的转换。

在这里我们看到转换报错了,为什么呢,因为转换工具是需要遵循一定的规则的,这个我们生成的没有遵循一定的规则,所以报错了,该怎么做,将错误信息复制下来,放到IDE的聊天工具里。然后直接说:
转换成PPT报错,
让大模型自动去修改,修改完成后再次进行转换:

直接打开PPT预览:

你可以按照前面的内容自己试一试,试玩你已经能复刻一页好看的 PPT 了。但真正的高手,是能稳定产出自己风格的人。怎么做到?答案还是回到那句话:把你脑子里的"感觉",翻译成 AI 能听懂的"参数"。
具体有三个抓手:
1 · 把风格拆成"可描述的关键词"别只说"我要高级感"。要说:"深色背景 + 大面积留白 + 金色点缀 + 衬线体标题"。把模糊的审美,拆成色彩、字体、布局、质感四个维度去描述。
比如我要生成自己公司风格的PPT该怎么做,其实在规则文件里限制就可以了,把对应的字体、颜色调成自己公司的就可以了,如果不知道自己公司的主题色是什么,那么就去公司官网logo上看,logo颜色就是公司主题色。

2 · 沉淀你自己的"风格模板"当你调出一套满意的配色和版式后,把它存下来——配色码、字体、间距规则、网格系统。下次做新主题,直接告诉 AI:"沿用上次的深空蓝 #0A0E17 + 古铜金 #D4AF37 配色,换成'黄鹤楼'主题"。复用,是效率的核心。
3 · 用"参考图"喂给 AI看到喜欢的设计,直接把图发给 Claude,让它分析:"这张图的配色、布局、字体层次是怎么做的?帮我用同样的思路做一页 XX 主题。"让 AI 帮你做风格的"逆向工程"。
这一步的本质,是从"完成一个任务"升级到"掌握一套能力"。方法论真正变成了你自己的实践论。
