AI PPT 的能力差距依然很大,Let's Talk~
AI PPT 的能力差距依然很大。复杂的场景先不说,就说一个最简单的幼儿园 Let's talk 的场景。
我的需求很简单,就是给它 6 句话,帮我生成 6 页 PPT,每一页上面有这句话,还有一张图。图应该画什么,我都已经告诉它了。但问题是,这里一定需要生图能力,所以生图能力强的 Agent 可能效果就会好一点。
下面是一些实测,我用了几个工具。
首先想到的是 Gemini,因为它可以接 Nano Banana 生图。但我试了好几次,不管怎样,它都舍不得用 Nano Banana,都是在网上找到的一些图,所以风格也不统一,样子也不好看。
后面还告诉我这些图的网址都是从哪个地方抓来的,让我很无语。甚至有一次它已经回复说已经用了 Nano Banana Pro,但其实最后生成的 PPT 还是从网上抓的,我不知道是为什么,可能因为还没有付费的原因吧。
然后我又想到了 ChatGPT,它可以用 GPT Image 来生图,效果应该也是不错的。同样的提示词,我发给它之后,只给我返回了一张图,上面有六个场景的文案和图,但是并没有生成 PPT。
这就很尴尬了,我已经明确说我最后要的是一个 PPT。后来我要让它修改成 PPT,它就只是把这几个图拆到了 PPT 的每一页中,比例和布局也不太好看。
然后我又试了豆包,豆包的整体效果和风格相对是比较一致的,是一个用豆包画图画的卡通风格的图,但我要求其实是迪士尼风格的。可能因为迪士尼是一个有版权的名字,就直接忽略了迪士尼风格。
后面我又用了千问,千问就更夸张了,完全是给了我一个很职场风格,堆了很多垃圾信息的 PPT,完全不是我想要的。
中间又试了扣子,Grok这些,都不是很满意。扣子生成的PPT不能直接预览,要发送到其他应用才行,无法理解这个操作。Grok 生成的直接打不开,后来修复了一次打开也是乱的,完全没用。
然后我又试了一下 TRAE。反倒是最后 TRAE 做出的效果比较符合我的预期,迪士尼风格也做到了。然后每一页的排版和画图都是相对比较稳定的,只是它右下角有个很明显的水印。我也懒得改了,就把它直接当作业交了。
有的人可能会说,你这个要求太少了,你应该给它规定得细一点,比如排版啊,每一页到底长什么样,甚至画图的 prompt 我都要给它。但如果作为一个普通用户的话,一定是希望我提的要求越简单越好,这样才能体现出智能体的智能性。如果我什么都跟它说得那么细,就显得不那么智能了是吧,你觉得呢?