技术观察 · 内容创作 PPT正在被HTML替代AI时代的演示文稿新范式 |
AI时代,演示文稿的创作方式正在发生一个微妙但根本的变化。
现在AI也能做PPT了,但你可能发现了——让AI生成一份PowerPoint文件,效果往往差强人意。排版歪斜、样式混乱、动画丢失,甚至打不开。这不是AI能力不行,而是PPTX格式本身的局限:它是二进制嵌套的XML,坐标、对象关系、主题继承层层耦合,AI要精确控制每一个像素,token消耗巨大,出错率还高。
从PPT到HTML,不是格式之争,而是演示媒介的自然演进——就像邮件从富文本走向HTML、文档从Word走向Markdown一样。而到了AI时代,这个演进的逻辑变得更加具体:
第一,更省Token。PPTX是二进制嵌套的XML格式,坐标计算、对象关系、主题继承层层耦合,AI要精确控制每一个像素,每一步都在大量消耗token。HTML则本质上是文本——大语言模型最擅长的事。同样的演示内容,走HTML路线比走PPTX路线节省大量token,输出质量反而更高。
第二,更规范可控。HTML结构清晰、标签语义明确,AI生成的每一行代码你都能看懂、能修改、能用Git版本管理。PPTX则是一个黑箱——AI在里面做了什么调整、为什么排版歪了,你可能永远搞不清楚。
一个开源项目正在实践这条路线:html-ppt-skill。
一句话安装:
npx skills add https://github.com/lewislulu/html-ppt-skill装完之后,你只需要对AI说:
"做一份8页的技术分享slides,用cyberpunk主题"
"把这个大纲转成一份pitch deck"
"做一个小红书图文,9张,白底柔和风"
AI直接生成完整的HTML演示文稿,浏览器打开即可。不需要PowerPoint,不需要Keynote,不需要任何桌面软件。
html-ppt-skill 不是一个demo级别的玩具,它提供了一套完整的演示文稿创作体系:
36个主题。 从极简白到赛博朋克霓虹,从日式侘寂到杂志粗体,从学术论文到VC路演——每个主题都是纯CSS令牌文件,换一行<link>就切换整套视觉风格。包括minimal-white、cyberpunk-neon、xiaohongshu-white、dracula、tokyo-night、vaporwave等。
31种页面布局。 封面、目录、分栏、数据网格、流程图、时间线、思维导图、对比表格、甘特图、代码展示、终端模拟……几乎覆盖了演示文稿的每一种常见版式。每种布局都带真实示例数据,直接丢进幻灯片就能用。
47种动画效果。 27种CSS动画(渐入、缩放、故障风、打字机、霓虹发光等)加上20种Canvas特效(粒子爆炸、烟花、星空、矩阵雨、知识图谱、神经网络信号脉冲、星系旋转等)。这些不是PPT里那种呆板的"飞入""擦除",而是真正的视觉特效。
15套完整模板。 8套从真实项目中提取的模板(小红书白底杂志风、暗底知识图谱、蓝图架构图、终端赛博朋克等),7套场景模板(路演、产品发布、技术分享、周报、小红书图文、课程模块等)。
传统PPT有个被忽视的优势——演讲者视图。你可以看到当前幻灯片、下一页预览、演讲笔记和计时器。
html-ppt-skill 新增的演讲者模式补上了这块短板。按S键,弹出独立的演讲者窗口,四个可拖拽、可缩放的磁吸卡片:
关键细节:预览用的是<iframe>加载同一份HTML,加上?preview=N参数只渲染第N页。这意味着预览和观众看到的效果像素级一致——同样的CSS、同样的主题、同样的字体。不是截图,不是模拟,就是真实的渲染结果。
两窗口通过BroadcastChannel保持同步,切换幻灯片时预览窗口无缝更新,不重载、不闪烁。
这不仅仅是"换了个格式",而是演示文稿创作范式的根本转变:
原生跨平台。 HTML是互联网的母语。任何设备、任何操作系统、任何浏览器,打开即用。不存在"你用什么系统"的问题。
零安装。 不需要安装任何桌面软件。一个HTML文件,双击浏览器打开。分享就是一个链接,不需要上传下载。
交互能力。 嵌入实时数据图表、嵌入交互组件、嵌入网页应用——HTML天生支持这些。PPT做不了的事,HTML做起来是基操。
AI原生。 这是最关键的一点。AI生成PowerPoint文件需要操作复杂的二进制格式,但生成HTML?那就是生成文本。大语言模型天生擅长这件事。html-ppt-skill 把"AI帮你做PPT"从"AI操作PPT软件"变成了"AI直接写演示文稿"——效率和灵活性的差距是数量级的。
版本可控。 HTML是纯文本,可以用Git管理版本。谁改了什么、什么时候改的,一目了然。团队协作不再是"你先做我后改"。
体积可控。 一个完整的多页演示文稿,HTML文件可能就几百KB。不需要嵌入字体文件、不需要打包图片资源、不需要生成臃肿的二进制容器。
html-ppt-skill 的架构设计也值得说道。它没有用任何前端框架,纯静态HTML/CSS/JS,零构建步骤。
整个视觉体系由令牌驱动——所有颜色、圆角、阴影、字体决策都定义在assets/base.css和当前主题文件中。改一个CSS变量,整套演示文稿自动重新渲染。这比PPT里逐页修改母版要优雅得多。
主题展示页面用<iframe>隔离渲染——每个预览都是独立的渲染实例,保证不同主题之间不会互相干扰。
字体方面,中英文一等公民——Noto Sans SC / Noto Serif SC预置导入,中文排版不需要额外配置。
具体看看html-ppt-skill提供了哪些布局:
信息展示类:cover(封面)、toc(目录)、section-divider(章节分隔)、bullets(要点列表)、big-quote(大段引用)、stat-highlight(数据亮点)
多栏类:two-column(双栏)、three-column(三栏)
数据类:kpi-grid(KPI网格)、table(表格)、chart-bar(柱状图)、chart-line(折线图)、chart-pie(饼图)、chart-radar(雷达图)
流程类:flow-diagram(流程图)、timeline(时间线)、roadmap(路线图)、process-steps(步骤)
代码类:code(代码展示)、diff(代码差异)、terminal(终端模拟)
对比类:comparison(对比)、pros-cons(优缺点)
其他:mindmap(思维导图)、gantt(甘特图)、image-hero(大图)、image-grid(图片网格)、arch-diagram(架构图)、todo-checklist(待办清单)、cta(行动号召)、thanks(致谢页)
每种布局都带有真实示例数据。你不是对着一个空模板发呆,而是看到一个完整渲染的页面,然后替换内容即可。
正式演示时,html-ppt-skill 提供了完整的键盘控制:
这些快捷键覆盖了正式演示中的核心操作。对于一个纯HTML文件来说,这个完成度已经超过了大多数在线演示工具。
上面介绍了 html-ppt-skill 的能力,下面是实际用它生成的演示文稿——就是用本文的内容,让 AI 生成了这份9页的小红书风格图文:









这就是 html-ppt-xhs 模板的效果:手绘风边框、贴纸标签、柔和渐变背景、emoji 装饰——全部纯 CSS 实现,不需要任何设计软件。
说"PPT正在被HTML替代",不是说明天所有人都会扔掉PowerPoint。大型企业内部的演示文化、学校里的课件习惯、政府机构的格式要求——这些不会一夜之间改变。
但变化已经开始了。当AI可以用一句话生成一份完整的、专业级的、跨平台的演示文稿时,"打开PowerPoint→新建→选模板→调格式→对齐→调动画→导出→发送"这套流程就显得过于笨重了。
html-ppt-skill 代表的不只是一个工具,而是一种新范式——演示文稿不再是桌面软件的专属产物,而是互联网的原生内容。它可以被AI生成、被Git管理、被浏览器渲染、被链接分享、被搜索引擎索引。
PPT用了三十年建立了一个封闭的演示文稿帝国。HTML正在用开放的互联网协议,一个文件一个文件地拆掉它的墙。
#html #ppt #AI创作 #演示文稿 #开源工具 #内容创作
👉 关注我,了解更多AI产品