一年前,打从AI agent的雏形出来,我就在各种测试AI如何能应用到实际工作上。从最开始Manus,到天工,后来到Kimi,Minimax……现在openclaw、workbuddy、codex这些工具不断迭代,大模型的能力也在不断升级。今天我就把国产的workbuddy和国外的codex加载github上比较受欢迎的skill,来测试一下AI生成ppt现在到什么程度,有什么样的因素会影响PPT的生成效果。Workbuddy的LLM我选择的是Kimi 2.6。之前我曾经用Kimi vibe coding了一个个人介绍网站出来,它的审美应该是目前市面上比较强的。而Codex的LLM我就是正常选择GPT-5.5。(之所以没有尝试Claude Code是因为太容易被封号了,折腾不起……)Skill方面,我用了github上比较受欢迎的frontend-slides、ppt-master、huashu-design这三个skill来尝试,这三个skill的区别见下方表格:我分别让Workbuddy和codex都针对2026年白酒市场做一份研究报告给我,效果如下:Workbuddy x huashu design:花叔说他的design 2.0 工作流现在是把调研的部分放在最前面的,所以我先测试了他,报告内容挺多我就不一一贴出来了,看个大概内容深度:内容的切入角度不一样,都比较切到重点,但是搭载Kimi的workbuddy很明显更喜欢用图表的方式来呈现,而且做图表的时候能看到他在数据条上是会有一些渐变的小细节设计在的。输出形式:workbuddy上来第一版是给我做了html格式,在我的要求下,可以改动成PPT格式,而codex是给我做成了ppt。设计风格:两者都用了比较沉稳的米色调来做ppt,配色没有问题。Codex甚至还给我自动生了个图做了封面,看起来挺有高级感。但是两个agent做出来的东西,都是一个模块一个模块,AI感都还是挺重的。
另外workbuddy很明显的问题在没有指引的情况下,生成的字很小,看上去空荡荡。PPT master是github上2.6万star的项目,内置了比较多的模板,是ppt类的项目里面star最多的项目之一了。内容深度:挂载了ppt master之后,workbuddy+kimi这个组合反而崩了,字还是一如既往的不合理,但是第一版做得比较好的图表细节都没有了而Codex+GPT 5.5 这个组合,虽然还是没有图表,但是把重点做了突出。而且ppt-master都做了简短的演讲者note在ppt里设计风格:不知道workbuddy是不是被前面的上下文惯性带偏了,他还是依旧选择了这个米色的底色做主要风格。但是字小的问题还是存在。另一边,codex选择了黑金色作为主色调,排版有惊喜,比前面单纯的整齐划一的模块设计有改进,字体大小勉强过得去吧,部分还是有待改进。
但是他用代码给画了个酒瓶的封面,有点奇怪……
Workbuddy x frontend slides:frontend slide在github上也是个有21k star的高好评项目,他的特点是34 bold 模板 + 12 预设风格以及可以做CSS动画 + JS过渡。
加载了这个skill,让workbuddy跑,他第一时间发了三个它觉得合适的模板出来给我看
风格A(麦肯锡风)
风格B
我选择了风格A(麦肯锡风),于是他就给我跑完了剩下的ppt,可以大概感受一下:从这里就不难看出,这种组合生成的ppt基本可以是说翻车了。可以看到,加载了frontend slide skill的比上一个ppt master版本设计理念上差不多,但是在一些细节控制上还是翻车了。那难道就没有办法了吗?于是我又搜寻了各种资料,最后发现可能是目前最终的处理方案:然后你可以把你的框架文件扔给lovart(需要科学上网,国内可以用星流),用image-2先生成ppt模板的board。这一步是为了先挑选和固定好你想要的样式。如果不满意就让他生成其他的样式,你可以给建议。如果觉得总体风格还可以,就可以让lovart把board才分成拆分成单独的高清图,然后再通过codex通过提示词限制,高强度还原生成的可编辑的ppt文件。






目前来看,在同样的提示词、加载同样的skill的前提下,Codex+GPT制作PPT的效果是要比workbuddy要好的但是最终最优解还是通过image-2强大的审美和制图能力先出基础,再让codex还原。之前我在网上看到说Agent的能力跟它本身的Harness是高度相关的,相信大家也能通过上面的测试看到了。经过这些测试,我可以推断出PPT的制作质量是 Agent X LLM大模型 X Skill共同作用决定的。成本方面,因为workbuddy有送积分,所以生成成本趋近于0,但是如果真的要烧token的话,目测一个ppt的制作大概要1-2元。而GPT 5.5本来就是不便宜的,而且Codex开了高推理的情况下,制作一个ppt的token成本我估计在4-5元左右(用API中转站的情况下)。但是对于不熟悉AI也没有怎么研究的普通人来说 ,部署Codex的门槛都已经相当高了。对于小白来说,用Agent来做PPT,workbuddy应该算是最优解;或者用Kimi的免费Agent额度也能做,但是自由度跟可控制度会下降。对于有耐心折腾的人,codex+GPT+image 2确实强。但前提是你需要知道你到底想要什么,无论是内容还是审美。
作者:我是艾伦,从 0 到 1 玩转 AI 工具的踩坑实录、提升效率的实操技巧、创意迸发的灵感瞬间。关注我,了解AI和学习AI,在探索中成长。