深夜点对着空白 PPT 发愁的痛,职场人懂得都懂。
最近刷到一个开源项目,作者给 AI 套了一身明朝官服,搞出一支六部 PPT 团队。皇帝下旨,锦衣卫调研,东厂核查,翰林院写大纲,工部出图,织造局做成品,内阁负责拍板。
我看完只想说俩字,服气。
先看一眼成品,下面这张图是它跑出来的 12 页 PPT 缩略图。
这个项目叫「大明 PPT Agent Team」,作者是沃垠 AI 。他干的事情其实很直接,就是把 PPT 这件事拆成了六个工种,每个工种安排一个独立的 AI Agent。
下面这张是它自己生成的 PPT 内页,把六部分工讲得明明白白:
我自己照着这个思路也画了一张关系图,看着更直观一点:
具体的分工是这样:
- ▸锦衣卫,全网深度调研,给你刨出 4000 字的研究报告
- ▸东厂,专门挑锦衣卫的毛病,事实核查,发现问题打回去重做
- ▸翰林院,按 TED 演讲的 3S 原则写 PPT 大纲,讲究故事感
- ▸织造局,把大纲和图片拼成最终的 HTML PPT
看到锦衣卫和东厂这一对,我笑出声了。一个负责说,一个负责找茬,活脱脱明朝官场内卷的味儿。
你可能会问,搞这么复杂干嘛,让 ChatGPT 一口气干完不就行了。
还真不行。
大模型有个老毛病,长任务越做越笨。一开始还挺精神,做着做着上下文塞太满,它就开始遗忘前面的指令,输出质量直线掉下来。你让一个 AI 又调研又写大纲又出图又排版,它做到一半基本就开始胡言乱语。
Multi-Agent 解决的就是这个问题。每个 Agent 上下文独立,只干一件事,不互相干扰。锦衣卫调研完把报告交给东厂,东厂核查完丢给翰林院,每一棒都是新鲜的。
这就是为什么大厂现在都在搞 Agent 工作流,不是炫技,是真扛得住活。
作者在文章里贴了实测过程。
他下了一道旨意,朕要做 PPT,六部听旨。然后整个团队就动起来了。
锦衣卫先出了一份 4000 字的深度研究报告。东厂拿到之后开始挑刺,发现哪几个数据没出处,打回去让锦衣卫重新查。这一来一回可能要好几轮,直到东厂点头才往下走。
翰林院拿到核查过的报告,开始写大纲。这一步用的是 TED 演讲的 3S 原则,讲究故事感。一份好 PPT 不是堆信息,是讲一个钩子到落点的完整故事。
工部根据大纲列出配图清单。织造局拿到大纲加图片,最终生成一份 HTML PPT,支持多种风格切换。
最终的封面长这样,深蓝底加波点,质感跟随便糊一个 GPT 模板完全两个段位:
整个项目都是开源的,代码和配置文件都在 GitHub 上:
项目地址:https://github.com/woyin2024/lengyi-ppt-agent-team
我觉得这个项目最妙的地方,不是它真的能做 PPT,而是它给了一个普通人也能复用的思路。
把一件复杂的事情,拆成几个清晰的工种,每个工种安排一个 AI 专员。你不用懂技术,不用写代码,只要能想清楚一件事需要哪几个角色,就能搭出自己的团队。
比如写一篇公众号文章,可以拆成选题官、调研员、写手、编辑、配图师。比如做一份周报,可以拆成数据采集、要点提炼、措辞润色、格式排版。
把自己想象成皇帝,把 AI 想象成自己的六部尚书。这种思维模式比单纯学 prompt 技巧高一个量级。
冷逸在文末说,他迫不及待要探索更多 Agent 架构玩法。我也挺期待的,这种东方风味的 Agent 设计,比硅谷那套 manager/worker/reviewer 看着舒服多了。
朕也想拥有自己的六部。
最后再放一张它自己生成的「六大核心亮点」页给你看,做 PPT 这事儿真不用再熬夜了:
原文:沃垠 AI 公众号《朕不想做 PPT,于是创造了大明 PPT Agent Team》