
上次盘点 7 个 AI 做 PPT 的开源 Skill推荐 | AI 做 PPT 的 7 个开源 Skill,我就在想,"还有其他的吗?"
刚好。
Agent Skills Hub 上 PPT & Presentation 分类的最新榜单,已经有 24个开源 Skill(项目中有一条重复了)。覆盖 HTML、Python、TypeScript、PowerShell;集成方式横跨 Claude Skill、Codex Skill、MCP Server、Agent Tool。
那么这次的目标不是再讲一遍"哪些路线"——而是回答一个更具体的问题: 如果你今天就要做一份 PPT,应该用哪一个?
上一次我们用"输出格式"做分类——HTML 派、PPTX 派、图片派。这套分法在 7 个 Skill 的范围内是干净的。但放到 24 个里,会发现有几类塞不进原来的盒子:
所以这次我把分类法升级了:
路线一:HTML 网页演示派 —— 单文件、零依赖、视觉天花板
路线二:原生 PPTX 派 —— 可编辑、能交付、商业刚需
路线三:AI 图像驱动派 —— 用图像模型解决"丑"的根本问题
路线四:MCP / 协议层 —— 给 LLM 装上操作 PowerPoint 的手
路线五:垂直场景专用 —— 学术、营销、翻译,专精战胜通用
路线六:综合设计平台 —— PPT 只是它的一个出口
每条路线挑代表性的细讲,文末给一张 24 个 Skill 全量对比表,外加 10 条决策路径。
视觉表现力的天花板。这一类的两个头部 Skill 上一篇我们已经详细聊过,这次按 Star 数补两个新面孔。
作者: @zarazhangrui GitHub:zarazhangrui/frontend-slidesStar: 16.9k | 类型: Claude Skill
依然是这个赛道 Star 数最高的项目。我上次盘点的时候它是 16.5k,几天涨了 400 颗星——这个增速本身就说明了一些东西。
如果你还没用过: 核心理念是"show, don't tell"——直接生成 3 个视觉预览让你挑,绕过"描述风格"这道槛。 12 套预设刻意回避紫色渐变审美,新加的 PPT 转换能力可以把 PowerPoint 转成 Web 演示。
作者: @op7418(歸藏) GitHub:op7418/guizang-ppt-skillStar: 6.1k | 类型: Claude Skill
电子杂志 × 电子墨水的视觉基调没变,5 套主题色(墨水经典、靛蓝瓷、森林墨、牛皮纸、沙丘)也还是那 5 套。两周前我说它"像 Monocle 杂志贴上了代码的样子",今天还是这个评价。
值得提一句的是, 这是一个会定期回炉的 Skill ——作者每次线下分享完都会把踩的坑写进 checklist。用它的时候,你不只是在用一个工具,你在用一个不断自我迭代的视觉规范。
作者: @hubeiqiao GitHub:hubeiqiao/apple-bento-gridStar: 169 | 类型: Claude Skill
如果你看过 Apple 发布会主题站点那种"一组方格、每格一个亮点"的卡片排版——就是这个 Skill 要做的事。
它不做完整 Deck,不做封面页正文页,只做一种东西: Apple-inspired bento grid presentation cards。 适合产品发布的"特性总览页"、技术分享的"成果一览页"、年终汇报的"数字一览页"。
把"小而专"做到极致,是这个 Skill 的态度。
作者: @alchaincyf GitHub:alchaincyf/deepseek-v4-deep-diveStar: 179 | 类型: AI Tool
这其实不是一个通用 Skill,而是一份"成品 + 模板"——DeepSeek V4 的深度解读 73 页 PPT,加 20 分钟讲稿,加发布动画。
但它进入这份榜单不是没有道理:当你需要做一份"AI 模型/产品深度解读"类的内容时,它的结构和动画手法可以直接拷贝下来当模板用。 某种意义上,这是 HTML PPT 的"开源样品间"。
商业交付的主战场。每一份"客户要能改"、"公司模板必须套用"的 PPT,最终都要落到 .pptx 文件上。这条路线下的 Skill 数量最多——8 个,是 25 个里占比最大的一类。
作者: @seulee26 GitHub:seulee26/mckinsey-pptxStar: 394 | 类型: Claude Skill
40 个麦肯锡风格的幻灯片模板,外加一个 会"为自己的选择辩护"的 subagent ——它会自动从 40 个模板里挑出最适合当前内容的那一个,然后告诉你为什么选这个不选那个。
作者是 AX Labs 的 이승필(韩国),这种"AI 自己解释决策"的设计在咨询场景里特别有用。 咨询行业的 PPT,本身就是一种"为决策辩护"的载体。 让 Skill 自己也学会辩护,是一种巧妙的同构。
作者: @likaku GitHub:likaku/Mck-ppt-design-skillStar: 127 | 类型: Claude Skill
直接打的就是"麦麸风格 PPT 设计系统"。 70 套布局模式 + flat design + python-pptx——作者把咨询公司常用的版式提炼成了一套可调用的库。
和上面的 mckinsey-pptx 是同类,区别在于侧重点:mckinsey-pptx 的核心是 subagent 决策逻辑,Mck-ppt-design-skill 的核心是布局丰富度。如果你已经知道自己要什么版式,用后者;如果你想让 AI 替你选,用前者。
作者: @promptadvisers GitHub:promptadvisers/claude-code-polished-documents-skillsStar: 51 | 类型: Claude Skill
这个 Skill 集合的最大卖点是 10 个 premium 品牌主题 ——McKinsey、Deloitte、Stripe、Apple、Notion 等。除 PPT 外还覆盖 docx、pdf、xlsx,是一套完整的 Office 文档润色工具集。
这是一个"借品牌质感来抬高自己输出审美下限"的 Skill。如果你不知道要什么风格,挑一个像 Stripe 的就行。
作者: @sunbigfly GitHub:sunbigfly/ppt-agent-skillsStar: 690 | 类型: Agent Tool
定位很清晰—— "像构建软件工程一样生成演示文稿" 的 code-driven 框架。
把 PPT 制作流程当作软件工程:有需求分析、架构设计、模块组装、测试验证。这种思路在做"重型 Deck"(几十页技术报告/产品白皮书)的时候特别有用——它会强迫你结构化思考,而不是页页拍脑袋。对做重型 Deck 特别有价值,比如几十页技术报告、产品白皮书、路演材料、解决方案汇报。它会强迫你先完成结构、叙事和风格约束,再逐页生产,而不是让模型一页页“自由发挥”。
产物上也比较实用:既有网页预览,方便快速查看演示效果;也能导出 PPTX,便于后续交付、修改和客户侧二次编辑。换句话说,它解决的是 AI 生成 PPT 里最常见的三个问题:内容失控、版式失控、交付不可编辑。
作者: @tfriedel GitHub:tfriedel/claude-office-skillsStar: 461 | 类型: Claude Skill
不只是 PPTX——PPTX、DOCX、XLSX、PDF 全部覆盖,还带自动化支持。这是一个"我在 Claude Code 里要处理 Office 文档"的工具兜底方案。
如果你不想为每种文档类型装一个独立 Skill,这个一站式覆盖的方案适合你。
作者: @barun-saha GitHub:barun-saha/slide-deck-aiStar: 352 | 类型: Agent Tool
定位是 "co-create PowerPoint slide decks with AI" ——不是让 AI 一把生成完,而是和 AI 一起来回打磨。
这是一个偏入门的 Python 项目,特点是轻——能跑就行,不太追求视觉。适合"工作汇报、内部讨论"这类不要求出彩、但要求快的场景,也适合刚开始尝试 AI 做 PPT、想理解每一步在干什么的人。
作者: @leonid20000 GitHub:leonid20000/odin-slidesStar: 146 | 类型: Agent Tool
这个 Skill 解决一个非常具体的需求—— "把超长 Word 文档变成结构化 PPT"。
这是一个真实痛点:写完几十页报告之后,你常常需要把它压缩成 30 页演示。手动来做就是反复 Ctrl+C / Ctrl+V,odin-slides 通过 LLM 自动把 Word 文档拆解、提炼、重组成 PPT 大纲。
适合学者、咨询、政府、企业研究——所有"先有长报告、再做演示"的工作流。
用 AI 图像模型生成每一页的内容图。这条路的本质是:与其和"AI PPT 长得很 AI"对抗,不如直接调用最强的图像模型生成最像设计师做的图。
作者: @op7418(歸藏) GitHub:op7418/NanoBanana-PPT-SkillsStar: 2.6k | 类型: AI Tool
歸藏的另一个项目——和 guizang-ppt-skill 走完全不同的路线。这个 Skill 基于 NanoBanana 模型自动生成 PPT 图片和视频,支持智能转场和交互式播放。
歸藏在两条路线上都布局了:HTML 派给"演讲分享"、图像派给"分享传播"。同一个作者,同一个审美底色,两种交付形态。
作者: @wuyoscar GitHub:wuyoscar/gpt_image_2_skillStar: 1.7k | 类型: Codex Skill
不是一个专做 PPT 的 Skill——按项目 README 的描述,它是 围绕 OpenAI gpt-image-2 构建的提示词画廊 + 提示词库 + agentic skill + CLI,覆盖科研配图、海报、UI mockup、字体、地图等多个图像生成场景。
但为什么它会出现在 PPT 榜单里?因为很多"图像驱动派"的 PPT Skill 本质上调用的就是 GPT Image 2。掌握了这个工具,你就拿到了底层的图像生成能力,可以反过来定制自己的 PPT 视觉风格。
作者: @JuneYaooo GitHub:JuneYaooo/gpt-image2-ppt-skillsStar: 346 | 类型: Claude Skill
这个 Skill 的玩法很有意思:项目宣称可以 把任意一份 .pptx 模板"图像级仿版式"成你自己的版本 ——gpt-image-2 负责模仿原模板的视觉版式,你只需要换内容。再附带 10 套精选风格作为兜底。
适合一个特殊场景:老板/客户给了你一份"按这个样子做"的 PPT 模板,但你又懒得手动复刻。一句提醒: 它的本质是图像级仿写,不是原生级复刻 ——成品的可编辑性受限,如果客户后续要逐字框修改,谨慎选这条路。
作者: @NyxTides GitHub:NyxTides/ppt-image-firstStar: 679 | 类型: Codex Skill
这个 Skill 的名字就是它的设计哲学—— image-first。先把视觉做对,再围绕图说话。它在 Codex、Claude Code、OpenCode CLI 都能跑,是个跨 Agent 的好兵。
适合做内容卡片、社交媒体配图、文章题图这种"图比字重要"的场景。但要特别提醒一句: 它默认用图像模型生成整页视觉图、再放进 PPTX 容器 ——成品更接近"高完成度视觉稿",不是逐文字框、逐图表都能编辑的原生 PPT。如果客户明确要后续深度改文案,请走原生 PPTX 路线。
这一类 Skill 不直接生成 PPT,它们的角色是 "给 LLM 装上操作 PowerPoint 的手"。把这些 MCP Server 接进去,你的 Claude/GPT 就获得了"读 PPTX、改 PPTX、写 PPTX"的能力。
作者: @GongRzhe GitHub:GongRzhe/Office-PowerPoint-MCP-ServerStar: 1.6k | 类型: MCP Server
把 python-pptx 这个老牌库包装成 MCP Server——通过 MCP 协议提供创建、编辑、操作 PowerPoint 的工具。
如果你在 Claude Desktop 或别的 MCP 客户端里,希望直接对话操作 .pptx 文件,这是最直接的方案。 它不挑 Skill,它就是 Skill 们的底盘。
作者: @NeekChaw GitHub:NeekChaw/mcp-server-okpptStar: 62 | 类型: MCP Server
这个项目的思路很巧—— 让 LLM 生成 SVG,再把 SVG 高质量地嵌进 PPTX,并保留矢量特性。
为什么这是个聪明的方案?因为 SVG 是 LLM 最擅长生成的图形格式,但 SVG 自己不是 PPT。把这两者打通,你就在 LLM 的强项上做了 PPT。
作者: @icip-cas(中科院信工所) GitHub:icip-cas/PPTAgentStar: 4.2k | 类型: MCP Server / Framework
这是一个学术机构做的项目—— "Agentic Framework for Reflective PowerPoint Generation"。Reflective 的意思是:Agent 生成完每一页之后,会回头检查这一页对不对、好不好、是否需要重做。
这是一个比较"重"的方案,更接近完整的研究框架而不是即用 Skill。但思想很值得借鉴: AI 做的 PPT 之所以丑,本质上是因为它没有"回头看"的环节。
通用 PPT 工具不可能在每个场景都最优。下面这几个 Skill 选择放弃通用性,专精于某个具体场景。
作者: @Gabberflast GitHub:Gabberflast/academic-pptx-skillStar: 172 | 类型: Claude Skill
为会议讲座、研讨会幻灯片、论文答辩、基金简报设计的 Skill。它强制执行 action title(行动式标题)、结构化论证、展品规范、引用标准、传播优先的设计。
学术 PPT 和商业 PPT 的最大区别是: 学术 PPT 的标题不是"市场分析"这种名词,而是"市场规模在 X 推动下三年翻倍"这种动词式句子。 这个 Skill 把这套学术 PPT 的套路代码化了。可以和 Anthropic 内置的 PPTX Skill 联动使用。
作者: @natolambert GitHub:natolambert/colloquiumStar: 172 | 类型: Agent Tool
也是学术导向,但走的是 "markdown native" 的路。学者们日常笔记本来就是 markdown,让 markdown 直接变成幻灯片,比从 markdown 转成 PPTX 再演示更顺畅。
适合"用 Obsidian/VSCode 写笔记 → 用同一份笔记直接讲课"的人。
作者: @minhnv0807 GitHub:minhnv0807/fullstack-mkt-skillsStar: 292 | 类型: Claude Skill
这是个意外——一个 PowerShell 写的 Claude Skill,包含 20 个 production-ready 营销 Skill:内容日历、TikTok/Meta 广告文案、UGC brief、KPI 计算器、A/B 测试、定价策略、落地页。基准数据是越南市场 2025-2026。
PPT 只是它能产的一种产物——它真正解决的是"营销内容流水线"。如果你是做品牌或增长的,这个比单独的 PPT Skill 更实用。
作者: @daekeun-ml GitHub:daekeun-ml/ppt-translatorStar: 58 | 类型: MCP Server
一个非常具体的需求—— 翻译 PowerPoint 的同时保留所有格式和结构。底层用 Amazon Bedrock 的模型,可以做 CLI 用,也可以做 MCP 接进 Claude/Kiro。
跨国团队、多语版本部署、本地化交付场景的硬刚需。 把 PPT 翻成另一门语言,最痛的不是翻译质量——是格式错位。 这个 Skill 的存在意义就在这里。
这一类已经超出了"PPT Skill"的边界——它们是平台级的产物,PPT 只是其中一个能力。
作者: @nexu-io GitHub:nexu-io/open-designStar: 35.3k | 类型: Codex Skill
榜单里的星数王。 35.3k Star ——比 frontend-slides 的 16.9k 还多一倍。
它的定位是 "Anthropic Claude Design 的本地优先开源替代品"。按 Agent Skills Hub 和仓库 About 的口径,它包含 19 个 Skill、71 套 brand-grade 设计系统;但仓库 README 顶部又出现过"31 Skills、72 套设计系统"的更新表述—— 这个项目迭代很快,建议以 GitHub 最新 README 为准。
能力面上,它能生成 web/desktop/mobile 原型、slides、images、videos、HyperFrames,沙箱预览、HTML/PDF/PPTX/MP4 导出,几乎所有主流 CLI 都支持——Claude Code、Codex、Cursor、Gemini、OpenCode、Qwen、Copilot、Hermes、Kimi。
这不是一个"PPT Skill"——这是一个"包含 PPT 能力的设计平台"。如果你做的不只是 PPT,而是从设计稿到落地的全流程,这个值得看。
作者: @docsagent GitHub:docsagent/docsagentStar: 574 | 类型: MCP Server
不是为做 PPT 而生—— 它是一个本地优先的 AI 文档助手,可以索引和对话桌面上几千份文档,零云端泄露。
为什么会出现在 PPT 榜单里?因为 做 PPT 的前置步骤往往是"消化大量参考文档"。把 docsagent 作为 PPT 工作流的"前置大脑",再用专业 PPT Skill 去出稿,这是一个值得考虑的组合用法。
一个口径说明:下面的 Star 数都来自 Agent Skills Hub 在 2026-05-10 这天的快照。这个赛道更新非常快——我顺手抽查了几个项目的实时数据,mckinsey-pptx、academic-pptx-skill在 GitHub 上的当下 Star 都已经明显高于榜单显示的数字。所以下面的数字是参考,不是实时排行—— 本文真正想交付的是"工具定位和选型逻辑",不是精确到个位数的 Star 榜。
1. 做客户能改的咨询风 PPT → mckinsey-pptx(让 AI 选模板)或 Mck-ppt-design-skill(你自己选)
2. 做品牌质感的商业 PPT → claude-code-polished-documents-skills(10 套品牌主题)
3. 演讲用的酷炫 HTML Deck → frontend-slides 或 guizang-ppt-skill
4. 做 Apple 风的特性卡片 → apple-bento-grid
5. 把长 Word 报告转成 PPT → odin-slides
6. 做学术报告 / 会议演讲 → academic-pptx-skill(PPTX 路线)或 colloquium(markdown 路线)
7. 把现有 PPT 翻译成英文 / 日文 → ppt-translator
8. 做营销内容(PPT 只是其中一项) → fullstack-mkt-skills
9. 让 LLM 直接操作我电脑里的 PPT 文件 → Office-PowerPoint-MCP-Server
10. 做的不只是 PPT,整套设计流程都要管 → open-design
两次盘点,从 7 个到 24 个,赛道的变化是显著的。
但比数量增加更重要的,是 专业分工开始细化。
第一次盘点的时候,所有 Skill 都在解决同一个问题——"怎么用 AI 把 PPT 做得好看"。
第二次再看,问题已经变成—— "针对我这个具体场景,最合适的 PPT Skill 是哪一个"。
学术报告找 academic-pptx-skill。咨询交付找 mckinsey-pptx。Apple 风格找 apple-bento-grid。本地化找 ppt-translator。营销流水线找 fullstack-mkt-skills。Word 转 PPT 找 odin-slides。
下一阶段会是什么?估计就是 "组合调度" 了吧 ——一个 meta-Skill 自动从这 24 个里挑出最合适的那个。其实,这件事 mckinsey-pptx 的 subagent 已经在做局部尝试了。
最后的提醒:
一是 开源不等于零门槛。这 24 个项目大多可以公开访问,主流许可证是 MIT 和 Apache-2.0,但并非每一个都在目录页明确标了开源协议。商用之前,回 GitHub 看一眼 LICENSE 这一步省不了。
二是 成本也不止是模型钱了。比如图像派要付 GPT Image 2 / NanoBanana的图像生成费;某些综合平台还可能涉及订阅和云服务。挑你能负担、且和工作流匹配的那条路。
挑一个开始用吧。