一个456 star的开源项目,把11种专业风格装进了11个JSON文件,我将它改造成了通用的skill,AI客户端直接调用即可输出精美PPT提示词,放到AI文生图模型中即可生成。
我做PPT的经历,大概和大多数打工人差不多——对着空白幻灯片发呆,花两小时选模板,再花三小时调排版,最后老板说"风格不对,重来"。

一直以来,我都是这么折腾PPT的,随着类似banana 2pro这类模型在中文输出方面的进化,也让PPT制作方式有了新的变化。
现在,直接使用一些skill技能+banana2Pro(相当级别)模型,就可以生成png、svg格式的PPT,这里不讲如何转成可编辑的PPT格式,那个需要一些周折才可以。
先说几个数据。
2025年的一份AIPPT行业报告显示,全球AI PPT工具的用户规模已经达到4.2亿,市场规模137亿美元。73%的世界500强企业把AIPPT纳入了标准工作流配置。
Gartner在2025年的未来办公趋势预测中也提到,到2026年,超过60%的知识工作者会日常使用AI辅助创作工具。
数据很漂亮,现实很骨感。
少数派今年年初做了一次横评,测了8款主流AI PPT工具——Gamma、豆包、Manus、讯飞智文……结论是"只有2款真正能用"。我自己也试了大一圈,最直接的感受是:生成的内容空洞,排版千篇一律,风格就像从同一个模板库里批量复制出来的。
我琢磨了很久,最后发现一个被大多数人忽略的点。

AI做PPT,瓶颈不在模型,在提示词。
这句话听起来像甩锅,但它背后有一个很具体的技术细节。
上个月我在GitHub上刷到一个项目,叫slides。作者AAAAAAAJ,456个star,MIT开源,Python写的,总共就17个commit。
项目做的事情,用一句话就能说清楚——生成PPT幻灯片的提示词。
但打开代码一看,它的思路跟市面上99%的AI PPT工具完全不一样。
大多数工具的做法是:你输入一个主题,工具在后台帮你写大纲、填内容、选模板、排页面。整个过程是个黑盒,你控制不了输出风格,也没法微调布局。
slides反过来了。它不帮你做PPT,它帮你写能让AI直接画出精美幻灯片的提示词。

具体怎么做的呢?
项目里有个styles文件夹,放着11个JSON文件,每个文件定义一种视觉风格:
每个JSON文件里,精确规定了背景色HEX值、调色板、网格布局参数、边距、焦点位置、纹理类型、字体选择、字号层级,连负面提示词都写好了。
使用方法更简单:在项目的PROMPTS.md里复制一段英文提示词,把标题、副标题、数据点替换成你自己的内容,粘贴到任何支持文生图的AI模型里,等几秒钟,一张16:9的幻灯片就出来了。

不用选模板。不用调排版。不用纠结配色。
提示词本身就是模板。
这个设计思路让我眼前一亮。说白了,它把"设计决策"从运行时前置到了配置时。你不需要每次都对AI说"用复古风格、背景设为米白色、主色调选粉红"——这些决策已经写死在JSON里了。你只需要提供内容,风格参数由配置文件自动注入。
slides原本是为OpenClaw平台设计的,配置文件用的skill.json格式。我日常使用的AI客户端是WorkBuddy,走的是通用SKILL.md格式。
所以我把它改了一下。
改造过程不复杂,主要是把格式转换过来,调整文件结构,更新提示词模板的读取逻辑。改完之后,任何支持通用skill格式的AI客户端都能用。
实际体验是这样的:我在AI客户端里说"帮我生成一页关于AI行业趋势的幻灯片",slides技能会自动根据内容判断风格,输出完整的图像生成提示词。我复制提示词,粘贴到文生图模型里,几秒钟出图。


想换风格?说一声就行。
要做一组完整的演示文稿?把每页内容告诉它,它会为每页自动匹配风格,逐页生成提示词。

整个流程里,我不需要懂设计,不需要懂配色,甚至不需要懂提示词工程。11种专业风格已经封装好了,拿来就用。
实测的时候我发现一个坑:国内一些免费文生图模型对提示词有字数限制。
比如腾讯混元,白嫖用户提示词要求500字以内。如果你走API付费通道,限制宽松得多,但免费额度用户就是500字一道硬门槛。

slides项目在这点上恰好有个优势——它的提示词模板本身就经过压缩。每个风格的模板大概100到200个英文单词,翻译成中文也不会超过500字。用国内免费模型跑得动。
这其实又引出了一个更大的话题。
Gemini的图像生成API,免费层每天给500次请求,每分钟10次。一张2048×1152的2K图,API调用成本大概0.02到0.04美元。
2026年初的行业对比数据很能说明问题:Google在免费图像生成上给的额度,比OpenAI的DALL-E、Midjourney、Stability AI加起来都多。
AI的生图能力,正在变成一种接近免费的基础设施。
能力本身不值钱了。值钱的是把能力封装成别人能直接用的东西。
回到slides这个项目。它做的事情用一句话概括:把AI图像生成能力封装成了11个即插即用的风格模块。
你不需要理解什么是HEX色值,不需要知道网格布局怎么算,不需要明白负空间设计为什么好看。这些全被关在JSON配置文件里了。你要做的,就是选一个风格,填上你的内容。
我叫它"AI能力乐高化"。
过去两年,AI领域最热闹的事情是"出大模型"。GPT、Claude、Gemini、混元、通义千问、DeepSeek……每隔几个月就有一个新模型登场。
但进入2026年,一个趋势越来越清晰:模型之间的差距在缩小,真正拉开差距的是"封装层"。
slides项目就是一个封装层。它把Gemini的图像生成能力封装成了"PPT风格模块"。你不需要直接面对AI模型,你面对的是已经调好参数、配好风格、写好提示词的成品。
GitHub上大量的小型开源项目都在做类似的事。有人把AI翻译封装成浏览器插件,有人把AI写作封装成微信机器人,有人把AI识图封装成证件照工具。底层模型越来越强,也越来越便宜(甚至免费)。上层封装越来越细,也越来越好用。
中间层——那些能把AI能力包装成具体产品的能力——正在成为新的竞争壁垒。
这对普通用户意味着什么呢?
意味着你不需要是AI专家,也能做出专业级的东西。但前提是你得学会两件事:找积木和拼积木。
找积木:在GitHub、AI技能市场、开源社区里,发现已经封装好的AI能力模块。slides就是一块"PPT设计"积木。
拼积木:把这些模块组合进你的工作流。一个PPT模块、一个写作模块、一个数据可视化模块,串起来就是你的个人AI工作台。
这件事不需要写代码。改造完的slides技能在AI客户端里直接对话就能用。未来会有越来越多这样的积木出现。
如果你对slides这个项目感兴趣,有三条路可以试。
直接用原版。 打开GitHub搜"AAAAAAAJ slides",进PROMPTS.md,选风格,复制提示词,替换标题和数据,粘贴到任何文生图模型里。

装技能版。 如果你的AI客户端支持通用skill格式,安装slides技能后用对话方式调用,自动匹配风格、自动生成提示词。

自己改。 MIT开源协议,随便改。加风格、调参数、换配色、适配不同模型,JSON结构清晰,改起来门槛不高。
不管选哪条,先试起来。
AI PPT这个领域工具迭代很快,今天好用的明天可能就变了。但"提示词即模板"这个思路大概率会持续很久。理解这个思路,比记住任何一个具体工具都重要。
往期PPT技能文章:
我用NotebookLM生成PPT后,才发现之前全都白做了(附提示词)
别再用PPT“念经”了:一个Prompt,让你的演示拥有乔布斯的神奇力量
https://github.com/AAAAAAAJ/slides
https://pan.quark.cn/s/10ed69b96fc6