大家好,我是汤师爷~
最近刷 GitHub,我刷到一个有点意思的项目,叫 html-ppt-skill。
上线 20 天,3600+ Star。
第一眼我以为又是某个 AI 做 PPT 的工具。
这种工具我见太多了,从 2024 年到现在,每隔几个月就冒出一个,热闹三天,没人记得。
但点进去看了一会儿,我愣了一下。
这个项目,它不叫 tool,不叫 generator,它叫 skill。

先说说它到底是个啥
做 PPT 这件事,说大不大,说小不小。
但凡你做过技术分享、产品 pitch、周报汇报,应该都有同感。
从零开始排版,一小时起步。要是还讲究字体、对齐、配色,两个小时打底。
这两年 AI 做 PPT 的方案不少,但大多数走的是同一条路,生成 PPTX 文件。
听着很美好。但你真用过就知道,PPTX 是个极度复杂的二进制格式,AI 吐出来的 PPTX 经常排版错位、字体丢失、图表变形。修 bug 的时间,比你自己手搓还长。
html-ppt-skill 换了个思路。
它不做 PPTX,只做 HTML。
我第一反应是,这思路有点东西。HTML 是纯文本,LLM 天然擅长生成文本。
HTML + CSS + JS 是浏览器原生支持的格式,双击即开,零依赖。
而且 HTML 可以做到极其精致,精致到你看不出这是 AI 生成的。
36 套主题,31 种布局,47 个动效
这是它内置的全部家当。
你对 Agent 说一句,做一份 8 页的SKill技术分享,暗色主题,要架构图和代码示例。
Agent 就从 36 套主题里挑合适的,从 31 种布局里组合,从 15 套模板里参考结构。
几分钟,一个完整的 HTML 文件出来了。浏览器打开,键盘翻页,效果媲美手动精调。
我说说我比较喜欢的几个细节。
主题这块,从 minimal-white、editorial-serif 这种适合学术汇报的极简风,到 cyberpunk-neon、terminal-green 这种适合技术分享的赛博风,再到 xiaohongshu-white 这种小红书柔和风,基本你能想到的场景都覆盖了。
按 T 键可以实时切换主题,36 套挨个试,找顺眼的为止。

模板这块更有意思。它不是凭空设计的,是从真实项目里提炼的 15 套完整 deck。
tech-sharing 是 GitHub 暗底风格,给技术分享用的。pitch-deck 是 YC 风格的融资路演模板。xhs-post 是 3:4 竖版的小红书图文。
还有一套 presenter-mode-reveal,每一页都带 150-300 字的示例逐字稿,专门配合演讲者模式设计。这个细节我后面会展开聊。

布局 31 种,从封面、目录、章节分隔,到代码展示、时间线、架构图、流程图,每种都带真实示例数据,复制粘贴就能用。

动效 47 个,27 个 CSS 动画加 20 个 Canvas FX。

前者轻量,适合常规入场。后者是手写的 canvas 模块,粒子爆发、星空飞行、神经网络脉冲这种电影级效果,适合封面或者关键页。

真正让我惊艳的,是演讲者模式
工具好不好,看细节。
做过技术分享的朋友应该知道,演讲者模式是个很容易翻车的地方。
你在自己电脑上看着挺好,一投影到大屏幕,预览和实际不一样。
字体不一样、间距不一样、颜色都不一样。当场就尴尬了。
html-ppt-skill 这块的处理,我是真的觉得用心。
按 S 键,弹出一个独立窗口。里面四个可拖拽可缩放的磁吸卡片,当前页预览、下一页预览、逐字稿、计时器。
关键是,每个预览卡片本质上是一个 iframe,加载的是同一份 HTML 文件,只是 URL 多了个 ?preview=N 参数。
什么意思呢?
预览和观众看到的,是完全相同的 CSS、主题、字体、viewport,像素级精确。不会出现「我这里好好的,怎么投出去就糊了」的尴尬。
翻页的时候,演讲者窗口通过 BroadcastChannel 和主窗口同步,用 postMessage 通知 iframe 切换。整个过程不重新加载,不白屏,不闪烁。
说真的,能把演讲者模式做到这个程度的工具,我没见过几个。

但真正打动我的,不是这些
聊到这儿,如果只是介绍一个 PPT 工具,那这篇文章也就到此为止了。
但我之所以想认真写一篇,是因为这个项目透传出来的一个信号。
它叫 skill,不叫 tool。
这个命名选择,背后是一整套生态逻辑。
html-ppt-skill 的安装命令只有一行:
npx skills add https://github.com/lewislulu/html-ppt-skill
装完之后,它就是一个 AgentSkill,AI Agent 的能力扩展模块。
但重点来了,它不只在一个平台上能用。
Claude Code 能用,因为 Claude Code 原生支持 AgentSkill 协议。
装完之后,Claude Code 自动识别,用自然语言就能触发。
OpenClaw 能用,作为 claw 命令调用,打通 35 万+ Star 的生态。
Hermes Agent 能用,自动注册为 /skill 斜杠命令,支持渐进式加载。
Cursor、Codex 也都能用,同样一行命令安装即用。

你装一次,能在四个甚至更多平台上用。
这不是某个框架的私有插件,而是一个遵循 agentskills.io 开放标准的标准化技能包。
这事儿在半年前,做不到
我跟你说,agentskills.io 这套开放标准我关注一段时间了。
最早出来的时候,我是有点怀疑的。AI 行业你也知道,喊「开放标准」的多了去了,最后大多数都成了某家公司的私有协议套个壳。
但 html-ppt-skill 跑通三端这件事,让我开始重新思考。
现在 agentskills.io 上有 85,000 个公开 Skill,27 个兼容平台。这个数字正在从「PPT 概念」变成「真实生态」。
这是一个特别像 2014 年 Docker 刚火起来那会儿的感觉。

那时候大家也吵,说容器化是不是噱头,说 Docker 会不会被某家厂商收编,说企业级用户会不会买账。
后来你也看到了,Dockerfile 成了云原生时代的标准件。
Skill 现在的位置,跟那时候的 Dockerfile 很像。一个 Skill 文件,描述清楚能力边界、依赖关系、调用方式,剩下的事就让平台去解决。
你的能力资产不再绑死在某个平台上。换个 Agent 框架,Skill 还能用。这件事的价值,做过开发的人应该最有体感。
我自己的一点观察
聊到这里,我想顺手聊聊一个更深的东西。
html-ppt-skill 本身是一个极其成熟的设计系统。36 套主题、31 种布局、47 个动效,全是写死的预制组件。
Agent 在这里能做的,是「组合」,而不是「创造」。
它的 SKILL.md 里甚至写了一条约束规则,「不要发明新布局,优先组合现有的」。
我一开始觉得这是不是太保守了。
但想了想,这反而是聪明做法。
LLM 现在最擅长什么?在约束条件下做组合。
最不擅长什么?从零创造一个有审美、有结构、不出错的东西。
你让它从零写 CSS、调字号、排架构图,它能给你弄出 100 个版本,每个都有点小问题。
但你给它一个清晰的组件库,告诉它「从这 31 种布局里挑」,它就能做得又快又稳。

这其实是一种新的 AI 工程范式。
不是「让 AI 从零生成一切」,而是「人提供约束良好的预制件,AI 在组合层面发挥」。
这个范式我觉得未来一两年会越来越主流。
当然,它也有一堆问题
写工具文章我最反感的就是只吹不贬。说几个我觉得是硬伤的地方。
没有可视化编辑器。生成完不满意,你要么重新让 Agent 改,要么自己手撸 HTML。没有拖拽,没有所见即所得。
不能导出 PPTX。虽然可以截图导成 PNG,但甲方爸爸要 .pptx 文件的话,这方案就废了。
你只能跑一下 ./scripts/render.sh,把每页渲染成 PNG,再手动粘到 PPT 里。这一步说实话挺反人类。
修改内容要直接改 HTML 源码。如果你完全不懂前端,这个门槛会有点高。
演讲者模式依赖弹窗。浏览器拦截弹窗的时候按 S 没反应。第一次用要手动允许弹窗。
Canvas FX 没有性能分级。粒子爆发、知识图谱这些效果,在手机上可能会卡。移动端演示要谨慎。
但这些局限和它的核心价值并不冲突。
技术分享、周报、产品 pitch、小红书图文,这些场景下,html-ppt-skill 的效率和一致性,远超传统方案。
怎么上手
如果你想试一下,最简单的方式:
npx skills add https://github.com/lewislulu/html-ppt-skill
然后在你的 Agent 里直接说:
「帮我做一份微服务架构的技术分享 PPT,10 页,暗色主题,要架构图和代码示例。」
不想装 skill 也行,直接 git clone 仓库,跑一下 ./scripts/new-deck.sh my-talk,浏览器打开生成的 HTML 就行。
快捷键我列一下,方便你查:

想感受效果的话,可以直接打开仓库里的 templates/theme-showcase.html,36 套主题一次看完。
或者打开 templates/full-decks-index.html,浏览全部 15 套完整模板。

最后说点心里话
回头看这个项目的名字,html-ppt-skill。
我一直觉得,命名是会暴露作者世界观的。
它没叫 tool,没叫 generator。它叫 skill。
这个选择背后,是一个我相信会成立的趋势:
在 2026 年,AI 能力的原子单元,正在从「工具」演变成「技能」。
工具是你装好以后再学怎么用。Skill 是你装好之后,告诉 Agent 一句话,它自己就干完了。
从 OpenClaw 的 13,000 个社区 Skill,到 Hermes 的自动 Skill 创建机制,到 agentskills.io 的 85,000 个标准化 Skill,再到 html-ppt-skill 跑通三端。
Skill 生态正在经历指数级增长。

html-ppt-skill 的 3600 Star,只是这个浪潮里的一朵小浪花。
但浪潮的方向已经很清楚了。
同一套技能,想在 Claude 上用就在 Claude 上用,想在 Hermes 上用就在 Hermes 上用,想在 OpenClaw 上用就在 OpenClaw 上用。
没有壁垒,不用迁移,不分阵营。
我有时候会想,AI 工程这件事,到底什么时候才算真的成熟。
之前我一直觉得,要看大模型能力。后来觉得,要看 Agent 框架。再后来觉得,要看 Skill 标准。
现在我有个新答案。
成熟的标志是,你做的东西不再绑死在任何一家公司的产品上。
你的 Skill 是你的,你的 Prompt 是你的,你的工作流是你的。换平台、换模型、换框架,你的资产都还在。
这事儿,html-ppt-skill 算是给我打了个样。
开源地址我也放这儿:https://github.com/lewislulu/html-ppt-skill
20 天 3600 Star,不是因为它是一个完美的 PPT 工具。
而是因为,它是 2026 年这场生态变革里,一个清晰可触摸的样本。
感谢你看到这里,如果觉得不错,随手点个赞、在看、转发三连~
如果想第一时间收到推送,也可以给我个星标⭐~