我之前一直认为是 gammas + Napkin AI 是 AI 生成 PPT 的最佳方案,但后来 napkin ai 开始收费,而且最近的豆包、Kimi 都可以生成 PPT 了,给 napkin ai 和 gammas 付费的意愿就没有了。
然而豆包、Kimi生成的 PPT 在内容深度上远远不够,即使给它们原始文本,生成的内容总是差那么一点儿意思。所以一段时间以来,我使用的 AIPPT 的“端到端”的解决方案是:使用谷歌 NotebookLM 生成图片型的 PPT(调用的是 nano banana 模型)。


或者在 Claude code 中使用宝玉老师的 skill 直接调 nano banana 的接口生成图片型的 PPT。使用这个 skill 的好处是风格、大纲、每页的内容都是可选的。
以上两种方案生成 PPT 的效果都非常棒,唯一的问题就是生成的是图片型的 PPT,需要使用 WPS 将图片型的 PPT 转化成可编辑的 PPT,进行二次编辑。
昨天 Claude 发布了 PowerPoint 中的 PPT 插件,我试了一下,感觉 Claude 在 AI PPT 方面,稳定性和可用性方面都超过了前面几种方案。
Claude PPT 的安装很简单,在微软的 Marketplace 搜索 Claude by Anthropic in PowerPoint,点击“立即获取”,登录你的微软账号,插件就自动下载安装。
之后你的 powerpoint 的功能区会出现一个 claude 的按钮,点击弹出你 Claude 账号的登录页面,登录进去就可以使用了:

我先测试将一个长文档发给它,要求它直接生成 50 页左右的 PPT。使用的文档是 Claude Opus 4.6 的 System Card 文档:

这是一份 200 多页的文档,Opus4.6 的 100K 上下文完全 hold 住。阅读完文档之后,就开始设计 PPT 的主题风格以及每一页的具体内容:

看具体的内容,claude 在直接通过代码操作 OOXML 格式。OOXML (Office Open XML) 是微软开发的基于 XML 的压缩文件格式(即我们常见的 .docx、.xlsx、.pptx)。

一顿操作之后,生成的效果都是这样的要点陈列的方式,50 页内容都是这样的:


这效果确实不怎么样。于是我让它修改,提了两个要求:一是告诉它某部分内容深度不够,需要阅读文档,提取更多的信息;二是告诉它要根据每一页的内容,生成一些图形化的表达。
效果非常棒,比如下面关于预训练、自适应思考以及发布决策这几页内容:



以及让它自己生成的图表:

最关键的一点在于,这些生成的内容都是在原生的 PowerPoint 软件里面生成的,所有生成的内容和元素都是可编辑的——可以手动编辑,哪张不满意也可以让 claude 编辑。
我根据自己的要求,让它基本将 50 页 PPT 都重新生成了一遍。期间还发现一个有趣的事情,模型会自动检测页面的布局问题,如果留白过多或者元素重叠,会自动调整。但是这个过程的 token 也真是在疯狂燃烧。

这是基于文档自动生成 PPT 。我接着又让它做了一个“自动调研+PPT 生成的工作”。这次调研的是AI PPT 生成的流派;我同时限定了 PPT 的背景为白色,主要色调为蓝色。
Claude 又是哐哐哐一顿操作,这次的工作步骤是,先使用网络搜索调研相关的技术流派;然后生成大纲;再根据大纲生成每页的内容;最后根据每页的内容确定布局,输出最终 PPT。
几分钟的时间就生成了一个10 页的 PPT。








这次生成的效果也不错,但可能是因为第一步调研的深度不够,在信息量上,第一次生成的内容还是有些欠缺。
但不管怎样,Claude 这波和 powerpoint 的结合,确实带来了一些新的内容:
即 AIPPT 能否在原生 PowerPoint 里进入可编辑、可迭代的闭环。这意味着 AI PPT 的主战场,正在迁移到“编辑器 + 代理式工作流”。
当然,也有代价:在这种闭环里,token 就是新的设计预算——每一次“改深一点”“再图形化一些”“把版式调顺”都在持续燃烧成本。