摘要:歸藏的 guizang-ppt-skill 10天破万星,但它不是又一个"AI生成PPT"的噱头。真正值得关注的,是它背后"把设计经验打包成Agent流程"的工程思路。
一、AI做PPT的痛点:不是不会做,而是做不好
如果你用过AI做PPT,一定经历过这种绝望:
第一页还挺像样,第二页开始字体乱套,第三页配色跑偏,第五页直接变成了"紫色渐变+圆角卡片+假图标"的土味模板。你让它改,它越改越乱;你亲自上手,发现还不如从头自己做。
问题的根源不是AI不够聪明,而是AI没有"审美约束"。
当你对Agent说"帮我做一份高级感的PPT",它听到的只是"高级感"三个字——每个人心中的高级感都不一样,AI只能凭概率猜测。结果就是:同一套需求,每次生成的风格都不一致;同一页deck,标题、正文、配图的视觉层级毫无章法。
2026年初,前大厂UI/UX设计师「歸藏」开源了一个项目,10天突破万星。它不是又一个"AI PPT工具",而是一套把设计经验固化成Agent工作流的Skill。
二、guizang-ppt-skill是什么?
guizang-ppt-skill 是一个专为 Claude Code / Codex / Cursor 等Agent环境设计的Skill,核心能力:
| 能力 |
说明 |
| 单文件HTML横向翻页PPT |
浏览器打开就能演示,无需安装软件 |
| 两套视觉系统 |
Style A 电子杂志风 / Style B 瑞士国际主义 |
| 锁定版式 |
Agent在预设模板里选版式、填内容,不临时发明CSS |
| 配图生成 |
支持GPT-Image 2.0生成照片、信息图、流程图 |
| 多平台封面 |
同一套视觉可输出公众号头图、小红书封面、视频号封面 |
| 版式校验器 |
自动检查标题位置、图片槽位、SVG规范 |
关键定位:它不是"让AI自由发挥",而是"把AI框在模板里"。
三、两套视觉系统:杂志风 vs 瑞士风
Style A · 电子杂志风
叙事感强,更自由。适合观点表达、个人分享、线下演讲。
内置5套主题色:墨水经典、靛蓝瓷、森林墨、牛皮纸、沙丘。切换方式只是替换CSS变量,其他样式全走var(--...)。
Style B · 瑞士国际主义
严格网格、直角、发丝线、单一高饱和锚点色。适合产品分析、方法论、商业发布。
内置22种锁定版式(S01-S22),通过data-image-slot属性标记图片槽位。Agent不能随意排版,只能在预设版式里做选择。
核心设计原则:"保护美学比给自由更重要"。
主题色只能从预设里选——克莱因蓝IKB、柠檬黄、柠檬绿、安全橙。不允许自定义hex。为什么?因为自由选色太容易破坏整体风格。
四、它解决了什么真问题?
1. "生成到第5页还能不能像同一份东西"
很多AI PPT工具的问题是:每页单独看都还行,放在一起就不像同一份deck。字体不统一、间距不一致、视觉节奏混乱。
guizang-ppt-skill的解法是模板锁定——Agent不是临时写CSS,而是从模板范围里选版式、填内容。10种杂志布局或22种瑞士版式,确保了整份PPT的视觉一致性。
腾讯云社区的技术博主评价:
"多数人不是卡在'能不能生成一页',而是卡在'生成到第5页还能不能像同一份东西'。"
2. 交付链路一体化
传统的PPT工作流是碎片化的:
- 写文章 → 用AI生成大纲 → 复制进PowerPoint → 手动调排版 → 去Unsplash找图 → 用Canva做封面 → 导出PDF
guizang-ppt-skill把这一串碎活放进了同一条线:
- 文章/素材 → Agent生成HTML PPT → 同时生成配图 → 同时输出多平台封面
单文件HTML的好处:浏览器能打开,就能讲。横向翻页、键盘←→、滚轮切页、触屏滑动,还支持ESC打开索引、B键切换低性能静态模式。
3. 版式校验器:拦住"第一眼像样,细看全错"
AI做视觉内容最怕什么?第一眼像样,细看全是小问题——标题位置不对、图片脱离槽位、SVG里塞文字。
guizang-ppt-skill给瑞士风配了一个校验脚本:
node scripts/validate-swiss-deck.mjs path/to/index.html
它会检查版式还原度,拦住明显跑偏的页面。这不是炫技,而是把"质量控制"从人的肉眼检查变成自动化流程。
五、但它不是万能药
说了优点,也必须说局限。根据官方文档和社区反馈:
1. 输出是HTML,不是PPTX
这意味着:
2. 需要Agent环境
没有文件系统和浏览器预览的普通Chatbot,很难稳定生成完整deck。它更适合Claude Code、Codex、Cursor这类本地Agent。
3. 设计自由度受限
主题色不能自定义,版式不能随意扩展。如果你需要完全个性化的设计,这套约束会变成枷锁。
4. 还在快速迭代
截至2026年5月,项目处于活跃开发期,WorkBuddy等平台适配还在进行中。
六、竞品对比:它站在哪?
| 工具 |
定位 |
优势 |
劣势 |
| guizang-ppt-skill |
Agent驱动的HTML演示 |
视觉一致、版式锁定、交付链路一体化 |
需Agent环境、输出HTML非PPTX |
| Gamma |
AI生成网页演示 |
在线协作、数据可视化 |
付费、模板同质化 |
| Tome |
AI叙事演示 |
故事感强、易用 |
自由度低、导出受限 |
| Beautiful.ai |
智能PPT设计 |
传统PPTX输出、团队协作 |
模板感重、AI能力弱 |
| Huashu Design |
HTML原生设计系统 |
覆盖原型/动画/信息图 |
学习曲线更陡 |
guizang-ppt-skill的独特定位是**"演讲deck生成器"**——不做万能设计工具,而是把"杂志风/瑞士风演讲PPT"这个场景做窄做深。
七、我的判断:它代表了一种更重要的趋势
综合官方文档、社区评测和个人分析,我对这个项目的看法:
第一,它解决了一个被忽视的核心问题:Agent的"稳定性"。
同样一句"做得高级一点",有时输出很好,有时滑向紫色渐变和圆角卡片。guizang-ppt-skill用模板锁定+主题色预设+版式校验,把"稳定性"补上了。
技术博主KnightLi评价:
"这类Skill的价值,不在于让AI随机发挥,而在于把'怎么做才不难看'这件事流程化。"
第二,它的真正创新不是"AI做PPT",而是"把设计经验打包成Skill"。
歸藏把10年UI/UX设计经验——版式系统、配色方案、视觉层级、检查清单——全部写进了SKILL.md和references/。Agent执行的不是一次prompt,而是一套经过验证的设计流程。
这比单纯的"AI生成"更有价值,因为它可复制、可迭代、可协作。
第三,它预示了Agent工作流的一个趋势:从"一次性生成"到"可重复执行的流程"。
未来的Agent工具,不会是越来越大的通用模型,而是越来越多像guizang-ppt-skill这样的领域Skill——把人的经验、审美和工作方法打包成代码,让Agent在约束中发挥,而不是在自由中失控。
八、写在最后
guizang-ppt-skill不是PowerPoint的替代品,也不是设计师的终结者。
它更适合这样的场景:你有一篇文章、一个产品分析、一次行业观察,需要快速变成一场8页左右的演讲。你不想在排版上浪费时间,但又忍受不了土味模板。
它的价值不在于"省了设计时间"——观点、结构、叙事节奏,这些仍然需要人来思考。它的价值在于**"把碎活交给Agent,让人专注在内容上"**。
如果你好奇,可以装一个试试:
npx skills add https://github.com/op7418/guizang-ppt-skill --skill guizang-ppt-skill
然后对你的Agent说:"帮我做一份瑞士风PPT。"
它会反过来问你7个问题——风格、受众、时长、素材、图片需求、主题色、硬约束。回答完,等几分钟,一份杂志级的HTML演示稿就躺在你的文件夹里了。
参考来源
- GitHub: https://github.com/op7418/guizang-ppt-skill[1]
- 腾讯云社区深度评测: https://cloud.tencent.com/developer/article/2672648[2]
- KnightLi场景解析: https://knightli.com/zh-tw/2026/05/09/guizang-ppt-skill-huashu-design-agent-skills[3]
- Awesome Skills收录: https://www.awesomeskills.dev/zh-CN/skill/op7418-guizang-ppt-skill[4]
- 歸藏X(Twitter): https://x.com/op7418[5]
引用链接
[1]https://github.com/op7418/guizang-ppt-skill
[2]https://cloud.tencent.com/developer/article/2672648
[3]https://knightli.com/zh-tw/2026/05/09/guizang-ppt-skill-huashu-design-agent-skills
[4]https://www.awesomeskills.dev/zh-CN/skill/op7418-guizang-ppt-skill
[5]https://x.com/op7418