基于开源项目 lewislulu/html-ppt-skill 实测 · 2026-06-07
我想先问你一个问题。
你做 PPT 最花时间的是哪个环节?
想内容?——大部分人其实想内容很快,脑子里有框架。
选模板?——翻模板确实花时间,但 10 分钟总能定下来。
最花时间的,永远是那一步:把内容摆进 PPT 里,然后调样式、对齐、改字体、调动画、导出。
内容在文档里,设计在审美里,排版在鼠标里,导出在软件里。人要在四五个环节之间来回切。
这不是你的问题。是 PPT 这个品类从诞生那天起,交付链路就这么设计的。
然后上周我看到了一个开源项目,它做的事很简单——把这条链路彻底压扁。
5600 星的项目,做了什么
项目叫 html-ppt-skill,GitHub 地址 lewislulu/html-ppt-skill,发布不到两个月,5600 多颗星。
它的想法很直接:PPT = 浏览器里的一组 HTML 页面。
36 套主题、31 种页面版式、27 种 CSS 动效、20 种 Canvas 特效、15 套完整的 Deck 模板——全部是纯静态 HTML/CSS/JS,不需要任何编译,浏览器直接打开就能看。
36 套主题不是 36 个模板文件,而是 36 个 CSS 变量文件。 换主题 = 换一组变量,所有页面同步换皮肤。按键盘上的 T 键,你就看着整份 PPT 在所有主题之间切换,像翻画册。
我花了一个下午亲自装了一遍。过程是:
git clone
bash new-deck.sh
浏览器打开 → 完成
三行命令,从零到看到第一页幻灯片,大概 30 秒。
真正的价值不在模板数量
36 套主题当然好。31 种版式、15 套 Deck 模板、47 种动效,每一项单独拿出来都能说事。
但这个项目真正有意思的地方,是它改变了 PPT 的生产关系。
传统 PPT 工具里,人是执行者。你要亲手操作每一个步骤。
html-ppt-skill 做的,是把 PPT 从人工排版对象变成了 AI 可直接调度的能力模块。
你看它的 SKILL.md 里写的用法:
“做一份 8 页的技术分享 slides,用 cyberpunk 主题”
“turn this outline into a pitch deck”
“做一个小红书图文,9 张,白底柔和风”
这些话不是写给用户看的,是写给 AI Agent 看的。Agent 收到指令后,自己去选模板、选主题、搭页面、配动画,最后吐出一份完整的 HTML。
人的角色从"执行排版"变成了"判断内容"。
问题从"这一页怎么做",变成了"这一页要不要这样表达"。
这是本质区别。
我测了三个场景
我自己跑了一轮测试,验证它能覆盖什么场景。
测试 1:技术分享
用默认的 tech-sharing 模板,应用 cyberpunk-neon 主题。6 页结构完整:封面→目录→数据→双栏内容→CTA→致谢。键盘翻页流畅,T 键换主题即时生效。通过。
测试 2:Pitch Deck
pitch-deck 模板预设了商业叙事的节奏——问题、方案、市场、团队、融资需求,每页骨架清楚。通过。
测试 3:小红书图文
xhs-post 模板是 9 页 3:4 竖版,配合 xiaohongshu-white 主题。这正是小红书图文的格式——白底柔和风,图片居中,文字简洁。通过。
三个场景都过了。范围从技术分享到商业路演再到社交图文,覆盖了日常高频的 PPT 需求。
和 Karpathy 说的 Software 3.0 是一回事
你还记得 Andrej Karpathy 说的 Software 3.0 吗?
他说当自然语言变成编程接口,AI 不再是辅助工具,而是直接承担执行层的工作。人只需要给定意图,AI 负责调度能力模块、生成中间产物、交付最终结果。
html-ppt-skill 就是 Software 3.0 在 PPT 这个品类上的具体落地。
它不是又一个 PPT 工具。它是一套让 AI 可以直接操作幻灯片生成的能力描述。36 个主题变量文件、31 个布局模板、15 套 Deck 模板——每一条都是 AI 的可调度单元。
以前要做一份 PPT,人的工作流大概是:
想内容 → 选模板 → 改样式 → 补图表 → 调动画 → 导出
现在:
人给需求 → Agent 调度模板 → 吐出成品 → 人做最终判断
四五个环节收成了两个。最大的收益不是省时间,是把人的精力从"执行排版"挪回"判断内容"。
边界与局限
但说句实话,它也有边界。
它的产出是 HTML/CSS/JS,不是 .pptx。这意味着你不能在 PowerPoint 里二次编辑,也不能用惯用的动画面板。接受 HTML 作为中间产物,是使用这套系统的前提。
另外,它需要一个能跑通的环境链路。虽然安装确实简单,但仍然需要 Node.js 和 Git(如果你要自己改源码)。
最适合三类人:
1. 需要快速出技术分享稿的人——工程师、产品经理做组内分享
2. 需要把提纲变成完整 Deck 的人——从文字大纲到视觉成品的一步到位
3. 需要做多页图文内容的人——小红书博主、社交媒体运营
参考来源:GitHub |lewislulu/html-ppt-skill(MIT 开源)