作为工程师,不管是在做 NoC / DDR 子系统的性能评估汇报,还是给团队梳理架构演进的 Review,我们总离不开写 PPT。
我们习惯了用脚本跑回归、看波形,甚至自己动手写 Agent 来自动化繁琐的分析工作。但在面对 PPT 时,很多人却还在手动复制粘贴。市面上虽然有很多“一键生成 PPT”的 AI 工具,但大多数产出的要么是无法修改的死图片,要么是排版混乱、充满“AI 塑料味”的废稿,后续二次修改的成本极高。
最近,我在 GitHub 上发现了一个非常符合咱们工程师“结构化思维”的开源项目:ppt-agent-workflow-san(渐进交互式 PPT 生成 Skill)。它把做 PPT 变成了一个像软件编译一样的可控 Pipeline。今天就把这个硬核提效技巧分享给大家。
🔗 项目地址:https://github.com/mucsbr/ppt-agent-workflow-san/tree/main
💡 核心理念:为什么它比普通 AI 工具好用?
这个项目最大的亮点在于它采用了 IR-first(中间表示优先) 的设计哲学,并且强调 Human-in-the-loop(人在回路) 的交互式生成。
它不追求“用一句 Prompt 盲盒式地生成最终文件”,而是将整个过程解耦为两个核心的子项目(Monorepo 架构):
ppt-workflow:负责内容的逻辑规划与生成,并导出 HTML 或 PNG 预览。html-slide-to-pptx:负责将结构化的 HTML 幻灯片,精准解析并转换为原生可编辑的 PPTX 文件。
这种内容与渲染分离的做法,非常像我们处理复杂验证任务时的分层架构,保证了每一步的输入输出都是可控的。
🛠️ 最佳实践:渐进式 PPT 生成工作流
结合咱们日常使用终端 AI 助手(比如 Claude Code)的习惯,官方推荐的标准工作流分为四个步骤:
第一步:内容生成与快速预览
首先使用 ppt-workflow 模块,让 AI 根据你的原始文档(比如一份技术设计 spec 或 Markdown 笔记)生成 PPT 的内容规划。Agent 会将其渲染为 HTML 或 PNG 格式。
这一步的核心是解决“讲什么”,你可以快速获得一个视觉化的草稿。
第二步:人工 Review 与结构确认
这是最关键的一步。 在拿到预览图或 HTML 后,不要急着生成最终文件。先检查它的版式设计、内容层级和重点表达是否有逻辑漏洞。因为此时修改的只是中间结构,调整成本极低。
第三步:一键转换为原生 PPTX
当预览效果确认无误后,我们就可以调用 html-slide-to-pptx 中的 HTML slide skill。它会像编译器一样,把确认好的 HTML 结构直接“编译”成原生 PPTX 文件。
注意:产出的是真正的原生 PPT——里面的文本框、形状都是独立的,你可以直接在 PowerPoint 里进行二次排版和精修。
第四步:自定义你的专属 Preset
如果你觉得生成的 HTML 结构不匹配公司或项目的已有模板(Preset),你完全可以先为 html-slide-to-pptx 增加对应的自定义 Preset,然后再执行转换。这意味着你可以建立一套自己的组件库,确保输出风格的高度统一。
总结
真正的自动化,不是让 AI 替你做完所有的事,而是让 AI 替你完成结构化的苦力活,把最后的决策权和打磨空间留给自己。
ppt-agent-workflow-san 提供了一种非常清晰的工程化解法:先预览结构,再生成最终文件,且保证 100% 可编辑。如果你最近正好在折腾 AI Agent 提效,或者手头积压了一堆技术文档需要转成 PPT 汇报,强烈建议在你的终端里挂载这个 Skill 试一试。
工欲善其事,必先利其器。把做 PPT 的时间省下来,多跑几组仿真,多看两眼代码,不香吗?
一起聊聊:大家在日常写技术 PPT 时,最头疼的环节是什么?有没有什么自己私藏的提效工具?欢迎进群交流!
超200人或7天以后,添加下面小编微信,邀请您进群交流!