

用规则约束AI,用HTML重做PPT。
在职场办公中,PPT 几乎是必须要面对的一环。
做项目汇报、阶段性复盘,还是给客户展示,最后通常都要做出一份逻辑清楚、看起来比较专业的幻灯片。
但其实真正耗费精力的往往不是内容怎么写,而是版式的调整。比如页面要对齐、字号得统一、配色要搭调,间距还得反复微调。好不容易改完一页,看下一页时又发现整体风格不太统一。
也正因为这样,利用 AI 来自动生成 PPT 已经成了大家比较关注的一个方向。
这次找了目前比较有代表性的 5 款 PPT Skill,用同一套提示词测了一下,主要是对比它们在生成质量、视觉效果、可操作性和实际好用程度上的差别。测试的结果比预想中更有意思。
Guizang PPT Skill
首先看看guizang-ppt-skill 的核心逻辑:
在 Skill 说明文件中让Agent明白要做什么,接着按不同的视觉风格挑好模板和版式,最后再用规则库和检查清单来把控生成的质量。
从结构上来说,它主要包含了这几个部分:主工作流说明、HTML 演示模板、版式参考、主题色方案、组件规则,还有配图提示词和质量检查工具。

它准备了两套不一样的视觉风格,一套是电子杂志风,比较看重标题、背景和整体氛围;
另一套是瑞士风格(Swiss Style),更强调网格排版、秩序感和留白。特别是在瑞士风格这一块,它没有让 AI 乱画,而是提前定好了能用的版式,要求正文页必须从固定的布局里选,这样就能解决 AI 做 PPT 时经常出现的风格不统一或者页面太乱的问题。
为了让页面显得更精细,它还自带了动效规则、配图标准和组件手册,像图片比例怎么调,系统图、信息图、UI 场景图怎么放,里面都有具体的说明。
项目里除了有针对常见页面问题的检查列表,还给瑞士风格专门写了校验脚本,用来核对版式、标题位置、图片占位和 SVG 文本这些细节。
很多 AI 生成的 PPT 感觉效果不稳定,其实就是因为少了这种限制和复查的环节。
该Skill生成的效果:

提示词:
你现在是一位拥有10年经验的顶尖商业计划书(Pitch Deck)策划专家。请帮我为一家名为「极跃办公(SmartFlow)」的初创企业生成一份完整的、面向VC投资人的商业计划书PPT大纲和内容。
项目背景: 这是一家专注于‘AI原生下一代智能办公空间’的 SaaS 公司(对标具有深度AI能力的飞书或Notion)。产品将大语言模型与日常办公深度绑定,能自动搞定会议纪要、一键生成周报/PPT、跨应用调度任务,旨在消灭职场人的“碎片化工具焦虑”和“重复性劳动”。
排版与设计要求:
整体设计风格:无特定限制,请完全自由发挥,根据“未来办公”和“AI智能”的产品定位,自主选择最匹配的模板,展现你最强的美学和排版能力。
每页PPT的内容请勿堆砌长篇大论,必须提炼成适合路演的要点(Bullet points),字数精简有力。
如果某页的逻辑适合用图表展示,请在文字中明确标注【建议插入XX图表】。
请严格按照以下15页的结构输出详细内容:
第1页:封面(包含极具吸引力的主标题和副标题,一句话说明我们是干什么的)
第2页:职场痛点(当前上班族面临的3个最抓狂的协同办公痛点:如工具切换、开会低效等)
第3页:我们的解决方案(「极跃办公」如何通过AI Agent重塑工作流)
第4页:三大核心杀手锏功能(例如:AI会议伴游、自动追溯知识库等)
第5页:市场规模(全球智能办公及效率工具的 TAM / SAM / SOM 分析,用合理虚拟数据)
第6页:精准用户画像(谁会为我们买单?列出2-3个典型职场人Persona)
第7页:商业变现模式(PLG模式,免费增值与企业版订阅定价)
第8页:早期运营数据/牵引力(列出3个亮眼的虚拟指标,比如:为每位用户每天节省X小时)
第9页:竞品分析(【排版大考:请务必以“对比表格”或“四象限图”的形式排版,列出我们与传统大厂(如钉钉/飞书)及 Notion AI 的差异化优势】)
第10页:我们的核心护城河(除算法外,为什么我们不怕巨头抄袭?)
第11页:市场获客策略(如何在早期不烧钱的情况下实现病毒式裂变?)
第12页:核心团队介绍(CEO、产品负责人、AI科学家的虚拟亮眼履历)
第13页:未来三年财务预测(MRR增长曲线与成本结构预测)
第14页:产品演进路线图(Roadmap:未来18个月从单点工具到生态平台的演进)
第15页:融资需求与资金用途(本次天使轮/A轮融资金额及具体分配饼图说明)”



Frontend Slides
frontend-slides 的核心思路很直接,用一组 Markdown 规则引导 AI 生成单页 HTML 幻灯片,再配几个脚本处理 PPTX 内容提取、部署和 PDF 导出。

结构上包含工作流说明、视觉主题库、HTML 模板、基础样式、动画规则和辅助脚本几个部分。
工作流入口文件负责判断用户的意图,是新建演示、转换 PPTX,还是增强已有的 HTML。视觉预设提供 12 套风格供选择。基础样式的职责是保证每页铺满屏幕、不乱滚动、不溢出。
HTML 模板规定了最终产物在导航、滚动、图片处理和编辑方面的行为逻辑。整套工具的最终输出就是一个独立的 HTML 文件。
有趣的地方在于,它把生成 PPT 的过程当成设计流程来走,先生成 3 个单页效果图,让用户看完再决定方向。同时也刻意回避了那种常见的 AI 模板感,比如通用字体、紫色渐变、白底卡片、千篇一律的网格布局。
以下是同样的提示词生成的效果:




Dokie-ai-ppt 的定位是对话式 HTML 演示文稿生成器,把 PPT 制作拆成一个严格的引导流程:先确认需求,再选主题,再确认大纲,最后才生成页面。
每一步都要给用户看结果并等待确认,不是一次性生成到底的模式。

模板系统分两层。一层是本地内置主题,包含 dokie-vibe、simple-blue-business、art-education 三套;
另一层是通过命令行工具拉取的在线主题,比如 Technology Company Deck、AI Summit Presentation、Finance Business Plan 等。
每页可以使用 Tailwind、Chart.js 4.5、Font Awesome 6.5 和 GSAP 来做图表、图标和动效,
同样的,该skill也有几条硬约束:禁止使用 emoji,禁止伪造图片 URL,必须严格按大纲走,主题风格必须保持一致,内容不能溢出。
批量生成时,先分析哪些页面属于同组,再按页序分批输出,通常一轮可以生成多页。
最后一步是预览,通过运行本地命令后会返回 localhost 链接,如果走 Cloudflare 通道可用还会附带公网链接。更多详情还可以阅读此链接
以下是同样的提示词生成的效果:

其中部分详情如下:



04.
HyperFrames
准确来说,huashu-design 并不算是一个专门用户制作PPT 的模板工具,更像是一套 HTML-first 的视觉表达方法。
它的核心思路是先在浏览器里把内容做成高保真的 HTML 作品,然后根据具体的应用场景,把它当成幻灯片、原型、信息图或者视频来演示。
和传统的 PPT 相比,它的优势在于排版更自由,能直接用 CSS 网格、字体层级和交互组件做出更有质感的页面,风格上更接近发布会、产品路演或者设计提案。

同时,它内部也集成了一些演示规范,比如幻灯片的节奏控制、字号安全、每页只讲一个核心观点等。跟其他的PPT Skill一样,它也是特意避开了那些 AI 感很重的紫色渐变和卡片堆叠,先通过两showcase来确定视觉风格。
当然,它的能力不只是做静态的 HTML 幻灯片。这个工具还自带了 animations.jsx、render-video.js 等工具链,能把 HTML 动画导出成 MP4 或 GIF,甚至能制作带配音的长视频。
以下是同样的提示词生成的效果:




GitHub链接:https://github.com/alchaincyf/huashu-design
05.
HyperFrames
类似的,HyperFrames 也可以理解成一款用 HTML 做演示内容的创作工具。
每一页都可以像 PPT 一样承载标题、图文、数据、卡片、产品介绍、路演结构,同时又比普通 PPT 多了网页级的排版自由度和动画能力。
用户可以按页浏览,也可以做成连续播放的演示体验。它支持封面页、章节页、数据页、对比页、时间线、图文排版、产品展示页等常见 PPT 结构,只是最终呈现方式不是 PowerPoint,而是浏览器里的动态展示稿。

它也内置了比较完整的动效和视觉制作能力。
比如每一页可以设置入场动画、转场、文字高亮、图表运动、字幕、配音、音乐节奏响应、产品演示镜头等。
另外,它有模板、组件和可复用模块的体系,可以从空白项目开始,也可以基于已有风格、示例、区块和组件快速搭建。
它还提供预览、检查、校验、渲染等流程,帮助确认页面有没有文字溢出、动画冲突、对比度不足或布局问题。
以下是同样的提示词生成的效果:




GitHub链接:https://github.com/heygen-com/hyperframes

掌握基于HTML的演示文稿设计方法,可以打破传统PPT的很多局限,发挥出网页的优势。
当然,如果说要转化为PPTX格式的话,也可以使用一些额外的skills。或者说使用像codex这样具有内置插件工具的agent进行语言对话转化即可。
其中,做好HTML PPT的关键是要先明确限制条件,比如目标听众、演示环境(浏览器的兼容性和屏幕比例)以及技术栈限制,然后再通过框架一步步进行主题提炼,从头脑风暴大纲开始,选Markdown或者纯HTML结构来填充具体内容。
尤其是我们可以看出大部分的一个PPT skill都会通过限制AI的一些边界,比如说AI常常喜欢输出紫色、淡紫色、暗沉的渐变色等,那么我们就可以强制要求他不要输出这种疲劳的过度审美。
此外,采用“先试后思”的迭代制作方式,也能帮助我们快速看到并验证实际的视觉效果,避免在页面上盲目堆砌各种元素。
通过CSS自定义属性来统一管理颜色、字体和页面布局,这样可以确保整个演示文稿的风格一致,后期修改也比较方便。
另外,在页面中加入iframe、实时代码高亮或者交互动画等元素,也能够很好地提高观众的参与感。
制作出美观PPT的关键,还在于要兼顾视觉叙事和简约原则。许多优秀的案例也提示我们,每一页幻灯片应该只聚焦一个核心观点,利用flex布局、多列设计和高质量的媒体素材,再配合上比较精炼的动画过渡效果。
同时我们还可以在一些本地库导入一些我们的原有的一些图片,或者说使用一个具有生图的Agent进行提示词限制,生成我们想要的图片,进而去加深整个视觉的体验。
外加上HTML的核心优势也正好体现在可以无缝嵌入各种样式,让演示过程本身就变成一种互动体验。




