最近兔会计摸索出一套Gemini和Notebook LM生成PPT的工作流,现在PPT是越做越快,而且效果一点不差,现在整理成文,供朋友们参考。
工具组合
2025年11月之前,AI做PPT是"图文分离"——先生成文本,再配图,拼在一起,可以感觉到拼凑感和割裂感。
Notebook LM底层是Nano Banana Pro 3的生图模型,每一页PPT本质上是一张图。文字、配图、排版在生成那一刻就是一体的,所以设计更加浑然一体。
我之前会这么做:
生成→不满意→手动改PPT→越改越乱。
经过一番摸索,我发现,应当把结构和内容问题,在提示词阶段解决掉。如果不满意,就回去改提示词,然后重新生成。先思考,后执行。
反我也不会写那些稀奇古怪的提示词,我也懒得去小红书、公众号上各种复制粘贴。
相反,我会这样问AI:"和我一起写生成PPT的提示词,应该从哪些方面去思考?"
AI自然会反问你:色调、布局、风格、排版、受众……
回答了这些问题,提示词自然就成型了。
具体流程
第一步:和大模型共创提示词
先把素材梳理成结构化的提示词,包含总体风格、配色、字体字号要求、每页的核心内容。这一步决定后面生成的质量和一致性。
第二步:NotebookLM生成
把素材传到Notebook LM,选择「演示文稿」,将提示词复制粘贴进去,等3-5分钟,获得PDF版PPT。
第三步:WPS中转换调整
用WPS的PDF转PPT功能,可以直接生成两个版本:纯图片版和OCR版。
然后取二者中满意的相结合,总体原则是:大字保留图片,小字替换文本。
因为:AI生图里面的文字,大标题清晰、有艺术感,适合直接用;小正文容易模糊,而OCR版里面的文字,WPS已经进行了字体字号的适配,更加合适,也方便编辑。
据此思考有两种方法:
从纯图片版出发:把不清晰的小字擦除,从OCR版复制粘贴对应的文字进去
从OCR版出发:把OCR出来的不美观的大标题和错误识别出来的文字删除,找到纯图片版里面对应的标题和图片,截图重新贴进去。
公司有模版,有VI的形象规范怎么办?
两个方法:
提示词写入:在提示词里直接写入公司VI规范(主色调、辅助色、字体、字号),生成出来就接近公司风格。
放入母版:使用Notebook LM生成的内容,从中提取核心元素,放入公司PPT母版。
PS:其实公司的市场部也应该思考新范式了,以前都是统一发放PPT模板和配色规范文件,其实现在可以统一发放提示词模板——把VI规范、常用结构、风格要求都写好,员工直接复制粘贴到Notebook LM,就可以很方便地生成符合公司调性的PPT。
迭代
需要改某一页的话,可以修改提示词,重新生成PPT,并取对应的页替换。注意保持提示词里的风格、配色、字号保持一致,重新生成的页便可以直接切进去,风格不会有差别。
这套流程的本质,是用一个AI的长处补另一个AI的短处。Nano Banana擅长视觉设计但文字生成有不清晰的问题,WPS的OCR擅长文字识别但没有设计能力,组合起来刚好互补。