字数 2579,阅读大约需 13 分钟

这周末我用 Codex 做了一个 Skill:
presentation-strategist
它看起来像 PPT 工具,但不是用来美化 PPT 的。
它不负责配色、排版、动画,也不直接导出 PPTX。它解决的是更靠前的问题:
做 PPT 之前,先判断这份 PPT 到底要完成什么沟通任务。
这是我做它的起点。
我越来越明显地感觉到,很多演讲汇报效果,不是 PPT 页面不好看,而是演讲人一开始就没想清楚。
漂亮但空心的 PPT一份 PPT 可以有漂亮封面、高级字体和现代动效。但如果它没有回答几个基本问题,还是很难真正起作用:
这些问题没有想清楚,页面越漂亮,有时候越危险。
因为它会把一个没想明白的判断,包装得像已经想明白了。
我为什么要做这个 Skill
PPT 表面上是视觉媒介,实际上经常是决策媒介。
给老板汇报项目,不只是同步信息。它可能是在解释延期、争取资源、重建信任,也可能是在推动一个关键决策。
给客户做提案,也不只是介绍产品。它要处理客户的怀疑:你们能不能交付?现在做是不是太早?投入产出能不能讲清楚?
做 AI 培训也一样。真正困难的不是解释 AI 是什么,而是让不同岗位的人知道:这件事和我有什么关系,我第一步应该怎么试。
这些场景都叫“讲 PPT”。但底层任务完全不同。
所以我不想再做一个“输入主题,生成页面”的工具。这个方向已经有很多产品和 Skill 在做。
我更想做的是 PPT 生成之前的那一层。
它不急着回答“做几页”,而是先问:
这场沟通到底要改变谁的什么判断?
PPT 是沟通任务它和几个热门 PPT 生成 Skill 的差异
presentation-strategist 的定位,要放到 PPT 工作流里看。
歸藏 PPT Skill 更强在视觉呈现。它擅长做有风格的网页 PPT,比如横向翻页、WebGL 背景、杂志感页面、瑞士风布局。它解决的是:怎么把内容变成一套可展示的 slides。
宝玉 slidedeck Skill 更像完整的幻灯片生成流水线。它可以从内容生成 outline,再生成每页 prompt,继续生成图片,最后合成 PPTX 或 PDF。它解决的是:已有内容怎么快速变成 slide deck。
PPT Master skill 更接近最终成稿生产。它降低的是制作门槛:输入主题或内容,快速得到结构化页面、模板、排版和完整文件。
而 presentation-strategist 放在更前面。
它先判断:这份 PPT 是为了汇报、说服、销售、培训,还是预警?听众卡在哪里?要改变的是认知、态度、判断,还是行动?证据够不够支撑结论?
如果把 PPT 工作流拆成四层:策略、结构、表达、视觉。
归藏类 Skill 更偏视觉层。宝玉 slide deck 更偏生产流水线。PPT Master 更偏快速成稿。
presentation-strategist 更偏策略层和结构层。
它不是替代这些工具,而是让这些工具在生成之前,先拿到更清楚的逻辑骨架。
我还给它设计了一个下游交接能力:当用户通过对话把 PPT 大纲定下来后,可以让它直接生成适配主流AI PPT 工具的输入提示词。这样它不只是做策略判断,也能把判断结果转成后续 AI PPT 工具可以直接使用的 brief。
PPT 工作流四层结构我是怎么一步步把它做出来的
这个 Skill 不是一次写完的。
它更像是从一个判断开始,一层一层长出来。
我先做的,是把问题限定住。
我一开始想解决的不是“怎么做一份漂亮 PPT”。而是:为什么很多 PPT 页面不错,但听完之后没有推动任何事情?
这个问题把方向带到了 PPT 生成之前:先判断沟通任务,再谈页面表达。
接着,我开始列真实场景。
老板汇报、项目进展、客户提案、销售 deck、融资路演、产品介绍、AI 培训、风险预警、业务复盘、个人职业 pitch。
这些场景表面不同,但底层都在试图改变听众的判断或行动。
场景列完之后,真正的原则才浮出来:
不从页数、模板和美化开始,而从受众变化开始。
如果用户说 “帮我做 10 页 PPT”,Skill 不应该直接进入第 1 页封面、第 2 页背景、第 3 页痛点。
它应该先判断:给谁看?希望对方改变什么?最大阻力是什么?这是告知、解释、说服、决策,还是动员?
然后,我把这个原则拆成 AI 能稳定执行的流程。
沟通目标、听众场景、事实/假设/未知、叙事结构、逐页计划、质量检查、下游 brief。
一个方法论如果不能被 AI 稳定执行,就还不是一个好 Skill。
从模糊想法到可生成 brief做到这里,我又做了一个取舍:不要把所有东西塞进主 Skill。
主 Skill 只保留高频、关键、稳定的行为规则。更细的场景方法、输出模板、质量检查,放进 references 或 templates,需要时再调用。
这样它就不是一段越来越长的提示词,而是一个小型工作系统。
最后,我补了普通用户入口。
真实用户不会说 “请帮我判断沟通任务和证据强度”。他们更可能说:“我明天要给老板汇报项目进展”“帮我把这个产品介绍做成客户提案”“先给我一个 5 页框架”。
所以这个 Skill 必须能接住低信息输入。
先给合理假设,再问少量关键问题,同时给一个可修改的 starter structure。
我为什么把 SkillOpt 的思路放进来
做到这里之后,这个 Skill 已经能用了。
但我想起前段时间读到的论文 SkillOpt: Executive Strategy for Self-Evolving Agent Skills,它给了我一个启发:Skill 不应该只是一份静态说明书,也可以是一种可训练的外部状态。
换句话说,Skill 文档本身也可以像模型参数一样,被一轮轮结果反过来训练。
过去优化 Skill,很容易变成手工补 prompt。
看到一个坏结果,补一句规则。再看到一个坏结果,再补一句规则。时间久了,Skill 就会变成补丁堆。
SkillOpt 的思路更工程化。
先让 Agent 带着当前 Skill 执行任务,收集轨迹和得分。再让优化器模型分析成功和失败样本,提出 add、delete、replace 这类文本编辑。每次编辑有预算。最后经过验证集门控,没有明显回归才接受。
我把这个思路迁移到了 presentation-strategist 里。
原因很简单:真实用户的表达太不可控。
用户只说“帮我做个老板汇报”,背后可能是高风险延期说明。用户说“帮我做客户提案”,真实任务可能是推动对方内部立项。用户说“明天要讲 AI 培训”,难点可能是降低一线员工抵触感。
这些东西靠一次性设计很难覆盖完整。
所以我给它设计了一个受控优化循环:收集样本、跑代表性任务、记录失败模式、生成候选修改、用验证集检查、没有回归才接受。
这里的重点不是“自动进化”,而是可验证、可回溯、可控制。
它主要解决两个问题:发现真实用户的表达盲区,防止改进变成退化。
SkillOpt 启发下的验证循环做完之后,我对 Skill 的理解更深了
做完这个 Skill 后,我对 Skill 的理解进一步加深了。
一开始我以为,Skill 的核心是把提示词写好。
后来发现不是。
真正重要的是把一个领域里的稳定判断过程,变成 AI 可以重复执行的小系统。
这个系统至少要有 清晰边界、核心原则、工作流、用户入口、下游输出、质量标准和持续改进机制。
这和写一个好 prompt 不太一样。
Prompt 更像一次表达。
Skill 更像一个产品。
它要考虑用户怎么进来,怎么得到结果,结果怎么被验证,怎么和其他工具连接,以及未来怎么继续变好。
presentation-strategist 这个项目让我最有感触的一点是:很多 AI 应用的真正价值,不是把人类工作的最后一步自动化,而是把前面最容易被忽略的判断过程显性化。
PPT 生成的最后一步是页面。
但PPT 质量的起点,是判断。
如果判断错了,页面越漂亮,反而越容易误导人。
presentation-strategist 做的,就是把这个判断过程提前。
它不是为了让 PPT 更炫,而是为了让 PPT 在变漂亮之前,先有一个清楚的沟通目标、可信的论证结构,以及明确的行动诉求。
Skill 不是提示词,是一个小系统这个 Skill 目前已经开源,访问链接:https://github.com/kingqiu/presentation-strategist
如果你也经常需要做老板汇报、客户提案、培训课件、路演 deck,或者只是觉得自己的 PPT 总是“页面有了,但逻辑没站住”,可以拿去试试。
也欢迎你在【评论区】告诉我:它在哪些场景下好用,哪些地方还不够顺。这类反馈,正好会成为它后续继续优化的材料。
以上是我今天分享的全部内容,如果你觉得有帮助,欢迎点赞、转发、收藏,让更多朋友受益。