用AI做PPT的尝试:豆包,GLM,ima,扣子……
这次做PPT的需求,是基于一份完整的逐字稿md,去做一份商务PPT。首先分析需求:逐字稿已经确定了每一页的内容,所以大部分内容,肯定是要用原文的,但有几个架构图、概念图之类的,要求更高一点,需要看起来更加机构化一点的样式。还有ppt需要是可编辑的,以便于对其中的文字或图片进行调整,毕竟这是一个长期使用的ppt,会更迭。- 一开始是23页的逐字稿,每一页都有详细的内容、配图建议、版式要求、演讲者备注,对整体风格也有要求,而且每一页的内容也很多,所有生成的ppt效果都谈不上很好;
- 然后改成了17页的逐字稿,每一页要求还是这么多,虽然内容做了一些精简,但每一页的内容还是偏多,这时候已经尝试了好几个ai ppt工具了,整体水平较好的已经选出来了;
- 然后又对这17页做了进一步的精简,我在这个基础上修改了逐字稿,把内容单独放一块,风格要求单独放一块,排版结构单独放一块,每一块、每一页都用标签包裹,这样生成的ppt在不同ai表现不同,但总体来说内容、结构都能较准确的显示出来了;
- 最终选用ChatGPT一页页的生图,然后贴到ppt,需要批量修改时就在提示词中加要求,然后重新一页页的生成所有图片;那网络慢的我心累,人在电脑面前一天都走不开,最后编辑ppt、加上公司模板元素,算是阶段性完成了;
- 虽然这次ppt任务完成了,我还在继续探索如何用ai生成可编辑的、高大上的ppt,目前在尝试的是open design,没有插图的高级感ppt也是一个尝试方向;
ChatGPT
- 生成图片真的强,不但可以把复杂的逻辑关系准确地用结构化的图形表现出来,而且中文的字都正确、清晰,甚至联想出关联的内容、图片,使内容十分的丰富详实、图文并茂;
- 问题1:只能一张一张的生图,想一下子生成多张,很容易会在一个图片里拼接多个图片内容,有时候好不容易让它一次性生成多张图里,下一轮回答一样的提示词,忽然就在一个图片里生成多图内容了;
- 问题2:好慢,生成慢,加载慢,下载慢,每次好等好几分钟,最长的等了半个小时都不止,切个对话再切回来,就是重新开始加载,基于分支新开对话,能等个把小时;或许是我网络原因,或者其他原因,总之等的人心累;
- 问题3:有时候自由发挥过度,远超当前想表达的内容,修改时必须明确把哪里去掉,不然改图时就很执拗,或者一放松限制它就会自由放飞,加上改图的出图、加载要等好久,一轮下来就是几十分钟,还不能批量;想要ChatGPT修改的好,指令越精细、越清晰越好;(连接ps、figma那个没发现用法)
- 问题4:ChatGPT可以用代码生成可编辑的ppt,但是直接生成的ppt排版看起来真的不行,和图片比起来有较大差距,而且不可以让ChatGPT在非生图模式或指令下,去生成ppt的图片,它会思考、然后用代码处理,一定要直接生图;
notebooklm
- google的直接用notebooklm,我觉得它在根据多数据源和大纲,自己发挥做PPT方面,应该很强,能理解要素之间的关系,做出结构化的表达、准确形象的配图,一些表现形式看了让我吃惊,没想到会这么表达;
- 问题1:首先是单个PPT15页的限制,虽然可以想办法拆分页面,先给15页,再给其他页,约束风格,但是ai在发挥时很难确保风格完整一致、统一;
- 问题2:这次的逐字稿内容很复杂,而且限制了每一页的标题和内容、风格要求、配图建议、构图建议、演讲者备注,且每一页字数多、内容多层次和结构,不知道是不是这个原因,生成的结果不太理想,包括整体风格变得有点不够逼格,而且越是遵守原文,逼格就掉的越严重;
- 问题3:ai会主动发挥去改内容,这是一个头疼和需要权衡的问题,ai是为了更好的表达和排版去改字的,不让ai改内容就限制了ai的发挥,让ai改内容很可能把自己想要表达的意思改变、删除或扩展了,ai又很难把握这个度、只能靠人;
- 问题4:生成的ppt,其实也是贴图稿,无法编辑。在notebooklm里编辑,也是单张图片进行ai编辑,想要改一些要素就很麻烦;
- 问题5:有时候中文会模糊不清,就好像中文就是生成的图片一样,会扭的看不懂,这个问题不算少见,核对和改起来又麻烦;
豆包
- 一次性生成了23页完整的ppt,内容很饱满,整整齐齐的,插图很少、但是有,主要是内容块搭配;可以直接点进ppt页面编辑元素,还可以添加页面切换动画;从快速、生成和编辑ppt便捷方面看,豆包很不错,简单、求效率的ppt可以考虑它;
- 问题1:会主动补充内容,把ppt填满,补充的内容对不对两说。另外,改了我的内容,改的有点离谱,我看到中间有一段在讲水泥,我都愣了,ai和水泥有什么关联关系?
- 问题2:不好看啊,这个和我在ChatGPT或一些开源工具里,用代码跑出来的结果,除了更加丰满,就差不多了;
- 问题3:没能够准确的表达出内容的结构和关系,虽然看起来多层级、多层次,当然能ai编辑是豆包的优势,但是能用ai一次生成排版布局正确的,就懒得去折腾豆包修改了;
智谱
- 可以生成完整的ppt,成果感觉和豆包很像,都是线框图形+文字为主,都可以在页面中直接编辑,还可以查看每一页的代码、分享ppt的制作文件和制作过程,值得一提的是智谱生成ppt的思考过程很有意思,值得一看;ppt内容也是和逐字稿比较一致;
- 问题1:排版不行,有的参差不齐的,有的图形结构没有准确的表现出内容关系;
- 问题2:不好看,没有插图,都是线框+图标为主,可能是目前代码生成ppt的最大短板了吧;
扣子
- 我付费了(因为付费才能去水印);扣子总体还不错,能快速生成完整的ppt,内容饱满,排版是目前我用的国产ai中生成质量最好的,有不少插图,对内容的理解也比较准确,插图+结构化图形也能较准确的表现出内容;整体看起来内容很丰富。
- 问题1:不够好看,那个又大又黑又粗的标题,那个撑满界面的内容,改不掉(可能是我提示词的问题?);前后生成+修改,一共出了十几版,没有一版是达到科技商务分的高级感标准的,很可惜,明明内容很好,可惜画风没跟上;
- 问题2:修改ppt时,有时候比较吃力,改改字、换换图还行,但如果是整体调整、或者改单张图片的时候,质量真不行,完全看不懂提示词一样,用标签包裹了也不行。如果一个页面内容变了或要重新排版,还不如改个提示词、新开会话重新生成了;
- 问题3:有一点烧积分,我觉得国内大多ai套餐蛮贵的,感觉模型没跟上、工具没跟上,价格和营销跟上了;
ima
- 意外吧,这是知识库工具,有个任务模式可以生成ppt,生成的效果还不错,工工整整的、清清爽爽的。同样是线框的图形为主,但加了不少的图表,看起来不是那么千篇一律(虽然有的图表是硬凑的)。知识库+PPT是个好思路。
- 问题1:问题和前面的豆包、智谱差不多,都是文字+线框组合,没有插图,所有不够高大上;然后结构化的表现不够准确;
- 问题2:修改不方便,准确的说是不能在线修改,生成以后只能看和下载了;
千问
千问生成的ppt,图文并茂、排版丰富,但是内容被改成另一个同主题的ppt了,更要命的是只可以下载成pdf。不止一次吐槽千问不接地气了,其他几个做的ppt能下载ppt,就它是pdf。其他工具
- workbuddy、Qclaw:本来还要算一个Qoder的,但是没有免费额度。workbuddy和Qclaw能生成ppt,但效果一般,和ChatGPT用代码生成的ppt一个水准,应该和skill或mcp有关;
- open design:claude design的开原平替版,使用电脑本地的cli工具完成设计;我使用codex cli输出了ppt的html版本,以线框+文字为主,和我想象中的牛逼哄哄的结果相差甚远,没有插图,没有高级感;或许是我使用方法不对吗?
- minimax:第一次试用,还没生成就没额度了。遂放弃。
- 不赘述了,基本上都是浅尝辄止;另外一些是觉得概念很不错,有机会可以试试,,
最后一些想法或说明
- ai输出创造性的东西具备随机性,而且不同的ai擅长的不同,所以我的使用体验、结果,不一定就是和你的相同,大胆的根据自己的需求多多尝试,用多了才知道好不好、哪里不好哪里好;
- 由于我重点是要输出符合要求的、可编辑的ppt,所以这些工具的其他功能我都没细看,比如分享功能等等。各自需求不同,建议多尝试几次以后,选择适合自己的。以上ai工具中,大多各自有其特点,而且有的agent工具极度依赖skill或mcp等,总会有出头之日的;