朋友问我有什么让 AI 制作 PPT 的好的办法吗。
其实有最简单的办法:豆包、chatgpt、minimax 这些都可以直接几句话制作一个 PPT。
但他想用自己的 AI,并且他本地有很多 PPT 制作需要的素材,所以上传给这几个 AI 就很不方便。
于是我找了一个还是蛮好用的一个 PPT 制作 Skill。
安装流程两步
# 克隆仓库然后安装依赖git clone https://github.com/hugohe3/ppt-master.gitcd /ppt-masterpip install -r requirements.txt# 安装skillnpx skills add hugohe3/ppt-master
然后就可以使用了。
如果你不懂 git,不懂 skill 也没问题,文章后面我提供了一个什么都不需要,甚至电脑都不需要用手机就可以体验一下的方案。
我先让 AI 基于项目写了一个介绍他自己的文章大纲
然后就让 AI 开始制作 PPT,并且我测试了一下不同的 AI 模型产出的 PPT 稳定性是否有差距。如下图所示,我分别用 GLM 和 MiMo 模型去生成。最终生成出来的几乎是一样的。
PPT 中的每一个内容都是可以直接编辑的,所以不用担心无法修改。
这个 skill 还有一个很厉害的功能,就是可以直接给 PPT 生成音频旁白,然后你再把 PPT 导出为视频,这就是一个可以直接对外发的视频了,不管是自媒体也好,汇报也好,都是很方便的。
默认使用的音频生成模型还是免费的,当然你也可以使用付费的模型克隆你自己的音色,换成你自己的声音。
音频制作完成后,你可以在播放 PPT 的时候去播放旁白音,或者把 PPT 导出为视频使用即可啦。
不过这里要注意一个问题,亲测发现 WPS 无法支持这种内嵌音频的 PPT 格式,不能正确的播放旁白音频。
我让 agent 去解决这个问题,它直接帮我导出了视频。
为了导出视频它又下载安装了一些依赖的库,还好我这是跑在 noteloom 的云端 Agent。如果是我自己电脑上,我的洁癖又要犯了,本来我的电脑磁盘空间就少得可怜了,还要给我下载一堆清理起来非常费劲的库。
有了这种方式,我们制作一些产品介绍的视频时,就不一定非要直接去想着找一个 可以制作视频的 AI 或者 SKILL,先制作成 PPT,然后人工去修这个 PPT,等内容都确定没有任何问题后,再输出一个视频。这样的一个制作流程在一些场景下反而才是最优解。
不过要注意一个事情,这个 skill 为了实现这些强大的能力,需要在电脑上安装很多依赖的包。如果你有电脑洁癖,最好跑在一个云端 Agent 上。
另一方便这里正好顺便说一下,你可能经常刷到大量的 skill 分享介绍的帖子,但真的不建议看到一个 SKILL 就随意的在电脑上安装。
这会带来几个问题:
管理费劲、模型侵入性大
skill 安装起来容易,但是管理起来很费劲,并且所有的skill 都是直接注入到你的模型上下文的(虽然只是注入一个描述信息),这很容易影响你的模型的日常工作中的判断,在一些不该使用 SKILL 的时候,胡乱的使用乱七八糟的 SKILL。
磁盘占用、安全隐患
很多skill 都需要个这个依赖包,有些复杂工程的 skill,也许会安装很多笨重的 依赖占用大量磁盘空间。
占用磁盘也就罢了,如果再携带一些有安全隐患的文件就更麻烦了。
所以大家下载 SKILL 的时候可以看一下是否已经过了安全扫描、是否是一个高下载量的。
不过对于普通用户最好的选择就是找一个云端的 agent 平台来安装和使用这些 skill,如果哪个 skill 真的是你平常工作中高频使用的,你已经确保这个 skill 没有什么问题了之后,再安装到自己的电脑上。
另外就是如果你不懂skill、cli、python、git 这些东西,想要使用一个 skill,最好的选择也是选择一个云端的 agent 平台。
扣子编程、豆包妙搭、minimax agent 、kimi agent等等这些的 agent 平台还是很多的。
不过他们都没提供终端环境,像一些需要手动执行一些shell命令的时候还是不太方便的。尤其是一些需要做一些凭证配置、或者自定义一些个性化数据的时候,就没办法了。
我上面截图里做测试用的是 noteloom,你创建一个项目就给你提供一个独立的云端操作系统,可以让 agent 在这个环境里自由发挥,不用担心破坏你的电脑。
noteloom 支持对话模式和工作流模式,这是它最大的特色。
给大家看一下我的完整工作流:
切换到对话模式的效果:
末尾放上最终生成的视频,这个视频本身内容就是介绍这个 skill 的,所以关于 skill 的详细介绍直接看这个视频就好啦。