你下周要汇报。
打开PowerPoint,盯着空白页面发了半小时呆。配色不会搭,字体选不对,找素材找到凌晨两点。最后做出来的东西,你自己都不想看第二眼。
这不是你的问题。是PPT这个工具本身就不对劲。
它把"内容表达"和"视觉设计"这两件事,硬生生捆在一起塞给你。你会写内容,不代表你会设计。你会设计,又未必有时间。结果就是,大部分人两头都顾不好。
那如果,你只需要写内容,设计交给AI呢?
不是那种"帮你生成模板然后你自己填"的AI。是那种你给它一份文字大纲,它直接还你一套16比9、2K分辨率、风格统一的完整PPT图片。每页一张图,拖进Keynote就能用。
这就是我今天要说的东西。一个开源的AI技能,叫ppt-generator。

它不是App,是一个"技能"
在说它怎么工作之前,先解释一个概念。
如果你用过OpenClaw、Claude Code或者OpenAI Codex,你应该知道这些AI工具不只是聊天机器人。它们可以装"技能"(Skill)。技能是什么?你可以把它理解为AI的"外挂"。
一个技能就是一套工作流。你告诉AI"帮我生成PPT",技能接管对话,自动完成一整套复杂的操作:解析大纲、生成封面、提取风格、逐页出图。你感知到的,只是"我丢了个大纲进去,过了一会儿拿到了一套PPT"。
这比普通的AI对话强大在哪?
普通的AI对话是即兴的。你问一句,它答一句。做PPT这种事,需要很多步:先理解你的大纲,再生成封面,再分析封面风格,再按这个风格生成内页。普通对话很难把这种复杂流程执行得稳定。
技能是预编程的。它把这些步骤写成了一套固定的、经过优化的工作流。每一步该做什么、失败了怎么重试、怎么确保风格统一,全都设计好了。你只管触发,它负责执行。
所以这不是"AI帮你做PPT"这么简单的概念。这是"AI变成了一位懂设计、有流程、能稳定交付的PPT设计师"。
三步上手,十分钟出图
安装过程简单得离谱。
第一步,把技能文件夹复制到你AI工具的技能目录。OpenClaw用户放 ~/.agents/skills/,Claude Code用户放 ~/.claude/skills/,Codex用户放 ~/.codex/skills/。一行命令的事。
第二步,改一下API密钥。这个技能需要调用gpt-image-2来生成图片,以及gpt-5.5来分析封面风格。填好base_url和api_key,完事。
第三步,在对话里丢大纲。
帮我生成这个PPT:
# 政务龙虾——广东省AI智能体政务应用实践
## 封面页
标题:政务龙虾——广东省AI智能体政务应用实践
副标题:从"问答"到"执行",AI如何重塑政务服务
## 第1页:什么是"政务龙虾"
基于开源AI智能体工具OpenClaw定制开发的政务版AI Agent系统
核心定位:从"被动问答"到"主动执行"的范式跃迁
## 第2页:DinTal Claw架构概览
微内核三层架构:Agent Loop、9个子工具、分层记忆系统
VS OpenClaw:2000行 vs 4.1万行,一键部署
## 第3页:AI进化路线图
2025H1:更聪明 → 2025H2:能做事 → 2026Q1:国产超车 → 2026Q2:能生产
然后你就不用管了。AI开始干活。
封面先行,AI自己定调
这个技能的工作流程,和很多AI PPT工具是反过来的。
一般的工具是:你先选一个模板,然后往里填内容。模板决定了风格。
这个技能是:你先写内容,AI根据内容生成封面,封面的风格决定整套PPT的调性。
为什么这样更合理?因为生图AI看标题比看人更准。你写"政务龙虾——广东省AI智能体政务应用实践",AI立刻感知到这是科技政务类内容,应该走科技蓝路线。你写"死了么——现象级产品爆火拆解",AI感知到黑色幽默的气质,自动走暗色电影质感路线。
封面上来,基调就定了。
政务龙虾的封面是这样的:一只蓝色水晶质感的龙虾矗立在广州城市天际线前,背景是珠江和广州塔。龙虾claws up的姿态,既有力量感,又点题。领导看到这个封面,还没翻页就觉得靠谱。

双通道锚定:风格不漂移的秘密
封面做好了,接下来的关键问题是:内页怎么和封面保持一致?
这是所有AI做PPT工具的痛处。封面是封面,内页是内页,AI做第二页的时候已经把第一页忘了。结果就是蓝色封面配绿色内页,科技风封面配文艺风内页,惨不忍睹。
这个技能用了两层保险来解决这个问题。
第一层:图生图。生成内页的时候,把封面图作为"参考图"传给生图AI。AI看到封面长什么样,颜色、字体、材质就直接对齐了。这是最强的风格锚定。
第二层:文字描述。技能用多模态AI读取封面图,自动提取两份东西:
•STYLE DESCRIPTION(氛围描述):比如"暗色电影质感,一束侧光营造悬疑氛围,粗体无衬线字体传递力量感"。•DESIGN SPEC(设计规范):比如主色#1a1a2e,辅色#e94560,标题用粗体左对齐。
生成内页的时候,这两份描述完整写入提示词,从文字层面再强化一遍风格要求。
双通道同时锚定。封面是什么风格,内页就是什么风格。想跑偏都难。


四个真实案例
光说原理不够,直接看结果。
案例一:暗色电影质感
主题:"死了么"产品爆火拆解
风格:暗调、电影感、黑色幽默
封面上一束光从门缝打进来,一个剪影站在光里,墙上写着"一个人没事记得打卡"。暗色调、强光影、悬疑氛围,和产品的黑色幽默气质完全贴合。
内页延续了这种暗调电影质感。产品概览页把手机mockup放在光影场景里,爆火四要素页用圆形图标在暗色背景上排列。整套PPT像一部电影的海报组。



案例二:科技蓝政务风
主题:政务龙虾AI智能体政务应用
风格:科技蓝、政务感、专业可信
封面上的蓝色水晶龙虾和广州天际线,内页一脉相承的科技蓝。架构概览页用分层立体设计展示三层架构,进化路线图页做四阶段时间轴。龙虾形象贯穿始终,视觉上有统一的品牌感。



案例三:清新科普风
主题:AI技术栈科普
风格:浅蓝、清晰、易读
大模型那页把四层关系用类比的方式画了出来:大模型是大脑,工作流平台是流水线,Agent框架是员工,具身智能是机器人。一目了然。
智能体双雄那页把OpenClaw和Hermes Agent拟人化,一个龙虾一个飞马,视觉上有冲击力,观众看一眼就能记住。



四套PPT,四种截然不同的风格,每一套内部都完美统一。
它也有局限
我不打算只说好话。这个技能有几个限制,用之前要知道。
第一,目前只输出PNG图片,不是PPTX。你需要把图片导入PowerPoint或Keynote。不过每张图就是一页,拖进去对齐就行,不麻烦。
第二,需要API密钥,而且要用到gpt-image-2,不是所有API商都支持。配之前先确认你的API商支持这个模型。
第三,中文渲染偶尔会有小问题。如果某个字显示异常,重试一次通常能解决。
第四,生成需要时间。一套3-4页的PPT,大概要5-10分钟。不适合"马上就要"的紧急场景。
但这些局限和它省下的时间相比,不值一提。自己做一套同等质量的PPT,从找模板到调配色到排版,保底两小时起步。用这个技能,写大纲3分钟,等生成10分钟,全程不超过15分钟。

谁应该试试
如果你符合下面任何一条,这个技能就值得装:
•用OpenClaw、Claude Code、Codex的AI用户
它不是万能的。但它把PPT制作中那七成最折磨人的设计工作,变成了"写大纲+等生成"这两件事。对于大多数人来说,这就够了。
GitHub地址:https://github.com/waytouniverse/waytouniverse-skills
去装一个,然后告诉我你的第一套AI PPT长什么样。