最近做了一组对比实验:左边是 Gemini 生成的 PPT 效果图,右边是我把这张图丢给 Claude Code(后端接的 Kimi K2.6)后复刻出的可编辑版本(单页pptx文件)。从排版到配色,基本做到了"所见即所得"。


单页复刻已经相当可用。但当我交给它更复杂的任务——直接根据一篇文献 PDF,按我的学术模板(左)生成完整 PPT(右) 时,问题出现了:打眼一看还行,但细看就会发现,内容略显单薄,排版有小瑕疵,多页之间风格漂移。


这让我确信一件事:AI 做 PPT 的瓶颈,从来不在工具能力,而在工作流设计。
AI 能生成单页好看的 PPT,但一做多了就乱。根因不是审美,而是架构思维缺失——AI 不理解 PPT 是一套分层的设计系统。只有你把这套层次讲清楚,AI 才能在全局一致的前提下处理局部细节。
我把 PPT 的架构拆成三个层级:全局设置 → 局部设置 → 原子组件。(在工程师视角的 PPT 重构指南中亦有提及)让 AI 按这个顺序逐层确认,出错的概率会大幅下降。

不要跟 AI 说"用绿色",要给它一套视觉宪法。这套宪法包含三条:
第一,配色方案。 不是随便挑几个好看的颜色,而是给每种颜色分配"职责":谁负责导航栏和表头这些结构性元素?谁负责正文和次要信息?谁只在页码徽章和差异高亮时跳出来?谁做卡片背景和交替行底色?背景用什么?颜色一旦分工明确,AI 就不会在不该跳脱的地方乱用强调色。
第二,字体层级。 学术/商务场景的字体组合通常是一套中英文字体搭配。关键是建立严格的字号阶梯:封面标题最大,页面标题次之,模块标题再次之,正文最小,注释最小。核心约束是同一层级内字号浮动不要超过 2pt,否则视觉节奏会乱。
第三,安全区域。 页面四周留出固定边距,顶部给导航栏,底部给页脚,中间才是内容区。所有元素必须落在这个"安全框"内。这是防止排版越界的底线——很多 AI 排版错乱,本质上就是元素跑到了安全区外面。
全局定好后,单页设计就有了约束框架。每页内容由四个局部元素构成:标题、导航、布局、单元。
标题区:左侧加一条竖线装饰作为视觉锚点,标题文字向右偏移,为竖线留空;标题下方保持呼吸空间,再开始正文。这条竖线看似装饰,实则是对齐基准——它让 AI 知道这一页的视觉起点在哪里。
导航区:等距排列的章节标签,当前章节用主色背景白字突出,其他章节用浅色背景弱化;导航栏底部压一条细线,与内容区隔开。导航的核心作用是建立页面之间的空间预期:读者扫一眼就知道自己在哪一章。
布局区:学术 PPT 最常用的布局是双栏对比。左栏讲痛点,右栏讲方案,两栏底部对齐,中间留出间隙。布局一旦确定,AI 就知道内容该往哪两个"容器"里填。
单元区:布局确定后,填充各种可复用的内容模块。
流程单元:横向流程用等距排列的圆角矩形卡片串联,卡片顶部有彩色标题条,中间用箭头连接,形成水平动线;纵向流程用圆形数字徽章引导,左侧对齐数字,右侧是标题+描述,步骤间距保持舒适,不要太挤。
表格单元:表头用主色背景白字加粗,数据行交替使用浅色和纯白增强可读性;描述类列要给足宽度,数值列可以收紧;文本必须紧贴表格背景,不留缝隙,否则文字会偏移。
原子组件是 PPT 的"乐高积木"。掌握它们,你就能拼装出任何复杂版式。
最后,把内容类型映射到布局模板。这是让 AI"知道该用什么版式"的关键规则:
这条匹配原则的本质是:让相同类型的内容每次都落在相同类型的版式里。 受众的大脑会自动建立预期——看到表格就知道是数据对比,看到流程图就知道是系统架构。AI 一旦掌握这套映射,排版的一致性就有了保障。
我曾卡在两个误区里:一是试图写一套完美规则一次性覆盖所有场景,二是以为迭代就是反复试错。
后来发现两条路都走不通。规则是跑出来的,不是想出来的;而真正的迭代不是重复劳动,而是有记录、有总结、有策略的进化。
上一篇文章里(三条铁律,让 Claude Code 乖乖听话)我提过一套闭环:执行前定计划,执行时查手册,执行后做版本控制并记录经验。 经验库越厚,犯过的错就越不会重复犯。
AI 复刻 PPT 时最顽固的毛病是排版错乱——屡教不改。怎么破?靠系统。
每次出错后,把问题描述、修正指令自动归档。让 AI 基于这些记录总结规律:哪些版式容易错位、哪些元素需要额外约束。下次生成时,它要么直接规避,要么在出错后凭经验快速自纠。
迭代系统的价值,在 PPT 这种高频、细碎的重复任务里体现得最明显。
有了系统,还要有策略。我的做法是分层推进,由简入繁:
第一层:简单任务先过关。 不要一上来就扔整份 PPT。先让 AI 只做一页,甚至只改一个配色。确保它能稳定交付,再谈下一步。
第二层:中等任务做打磨。 简单任务没问题后,逐步加码。完成度不高时,调用 Skill 和归档经验反复迭代,直到它"学会"这一类版式。
第三层:复杂任务靠拆解。 别指望 AI 一次生成 30 页完美幻灯片。把大任务拆成 AI 100% 能 hold 住的小模块:封面页、目录页、图表页、总结页……逐个击破,再组装。
拆解的依据有两个:一是你自己的业务思维,二是对 AI 能力边界的清晰认知——每个子任务都必须落在它的舒适区内。
迭代系统的本质是:用结构化的经验对抗随机性,用分层推进驯服复杂度。 当你不再追求一次到位,而是追求每一次都比上一次更聪明,AI 做 PPT 这件事,才算真正上了轨道。
#2D5A3D(深绿)、Secondary #5A7D5A(中绿)、Accent #DAA520(金色)、Light #E8F3E8(浅绿)、Background #FFFFFF(纯白)及其精确使用场景#2D5A3D + 白字,其他章节浅绿背景 #E8F3E8 + 中绿文字 #5A7D5A;底部贯穿细线 h: 0.025"#2D5A3D + 白字 10-11pt 加粗;数据行交替浅绿 #E8F3E8 / 纯白;描述列宽 2.1",数值列 0.9"~1.3";行高 0.32";右边界 ≤ 8.0";文本叠加时 inset: 0含封面、目录、背景/概念、系统架构、数据结果、分类性能、错误分析、结论、致谢共 9 种版式的精确组件配置。