上个月开会,同事投了一屏幻灯片,全场安静了三秒——不是因为内容多震撼,而是因为那套模板实在太丑了。
我们早就过了"美化靠美术、排版靠手动"的年代。现在随便打开 GitHub 搜一下 "PPT Skill",你会发现一个让我自己都吃惊的数字:超过 25 个开源项目,累计收获 7 万多颗 Star。这些项目做的事情,简单说就是——让 AI 替你把 PPT 做好,甚至做得比你手动调两个小时还好。
我花了整整一个周末,把这堆项目逐个跑了一遍,按它们底层的技术思路分了 6 个派系,最后筛出 16 个值得收藏的(标准很简单:有 GitHub 地址、有实际效果图)。下面是我的实测笔记。
一张图看懂 6 大路线:● HTML 网页演示 — 生成 .html,浏览器直接打开,视觉效果拉满● 原生 PPTX — 生成 .pptx,每个元素都能点能改● AI 图像驱动 — 让大模型画图出页面,视觉完成度最高● MCP 协议层 — 给语言模型装上操控 PowerPoint 的手● 垂直场景专用 — 只为学术、翻译等特定场景服务● 综合设计平台 — PPT 只是基本功,原型和 UI 也能做
路线一:HTML 网页演示派
不走 PowerPoint 这条路,直接用网页呈现——单文件、零安装、打开浏览器就能演示
frontend-slides — 17,530 Stars

GitHub:https://github.com/zarazhangrui/frontend-slides | 作者:@zarazhangrui
这一整个赛道里 Star 数最高的选手。它最聪明的做法是跳过了"你想要什么风格"这步沟通成本——直接丢 3 个不同风格的预览版让你选,选中了再往下走。内置 12 套经过设计的视觉预设,而且作者明显研究过市面上那些"AI 味很重"的演示,刻意避开了那种一看就是机器生成的紫色调渐变审美。还支持把已有的 PowerPoint 反向转成 Web 版本。
guizang-ppt-skill — 8,832 Stars


GitHub:https://github.com/op7418/guizang-ppt-skill | 作者:@op7418(歸藏)
歸藏大概是国内做 Agent Skill 最活跃的开发者之一。这个项目最让我印象深刻的是它同时做了两套完全不同审美的视觉系统:Style A 走电子杂志路线,用 WebGL 做流体动态背景,擅长讲故事的叙事型演示;Style B 走瑞士国际主义,网格锁定、提供 22 种版式变体,适合数据密集型汇报。只给 5 套主题色,不允许自定义 hex 值——作者的态度很明确:保护审美比给自由更重要。
html-ppt-skill — 3,834 Stars


GitHub:https://github.com/lewislulu/html-ppt-skill | 作者:@lewislulu
论"量大管饱",这个项目说第二没人敢第一。36 套主题、31 种布局、47 种动画效果(27 种 CSS 动画加 20 种 Canvas 特效),数字拉满。但它不只是堆参数,还做了一个真正能用的演讲者模式——按 S 键弹出独立窗口,里面有当前幻灯片、下一页预览、逐字稿提示器和计时器,主屏幕和演讲者窗口实时同步。这个细节说明作者自己就是高频使用者。
apple-bento-grid — 171 Stars

GitHub:https://github.com/hubeiqiao/apple-bento-grid | 作者:@hubeiqiao
Star 数不多,但方向特别精准——它就做一件事:复刻苹果发布会上那种"一组方格、每格一个亮点"的 Bento 卡片排版。产品发布特性总览、年终汇报数字摘要这类场景,用它非常对路。"小而专"这种路线在 Skill 生态里反而更容易出精品。
路线二:原生 PPTX 派
输出 .pptx 文件,每个文字框、形状、图表都是可编辑对象——客户拿到就能改
ppt-master — 16,626 Stars

GitHub:https://github.com/hugohe3/ppt-master | 作者:@hugohe3
这组里最重磅的项目,没有之一。它走的是SVG 转原生 DrawingML 的技术路线:先让 LLM 生成 SVG 矢量图,再转换成 PowerPoint 原生图形对象。意味着生成的每一页里,文字、形状、图表全都是真正的可编辑元素,不是贴上去的一张图片。支持从 PDF、Word、网页链接、Markdown 等多种来源生成,还能做模板复刻、动画、语音旁白。代价是需要 Claude Opus 或 Sonnet 级别的大上下文模型。
ppt-agent-skills — 714 Stars

GitHub:https://github.com/sunbigfly/ppt-agent-skills | 作者:@sunbigfly
这个项目的设计思路挺有趣——它把做 PPT 这件事完全当成了软件工程来处理。需求分析、架构设计、模块组装、测试验证,标准开发流程的每一步都被映射到了演示文稿的制作过程中。做那种几十页的技术报告型 Deck 时特别顺手,产物既有网页预览版也能导出 PPTX。
mckinsey-pptx — 426 Stars

GitHub:https://github.com/seulee26/mckinsey-pptx | 作者:@seulee26
40 套麦肯锡风格模板打底,但真正的亮点在于它内置了一个会"为自己的选择辩护"的子代理——当它从 40 个模板里选定某个方案后,会自动输出一段选择理由。考虑到咨询行业做 PPT 本质上就是在"为决策辩护",让 Skill 也学会辩论,算是一个很巧妙的设计隐喻。
Mck-ppt-design-skill — 135 Stars

GitHub:https://github.com/likaku/Mck-ppt-design-skill | 作者:@likaku
同样是麦肯锡路线,但和上面那个定位不同。70 种布局模式加上 flat design 风格和 python-pptx 底层。上一个核心卖点是智能选模板的决策逻辑,这个核心卖点是布局的丰富程度。选型建议:你知道自己要什么版式就用这个,想让 AI 帮你选就用上一个。
路线三:AI 图像驱动派
让图像大模型逐页画出高完成度的视觉稿——效果最好,但二次编辑空间有限
NanoBanana-PPT-Skills — 2,668 Stars

GitHub:https://github.com/op7418/NanoBanana-PPT-Skills | 作者:@op7418(歸藏)
歸藏在这个赛道也布了子。和前面那个走 HTML 路线的 guizang-ppt-skill 完全不同,这个是基于 NanoBanana 图像模型来逐页生成 PPT 图片和视频的。支持智能转场和交互式播放。歸藏两条路线都布局了——HTML 派给正式演讲分享用,图像派给传播分发用,逻辑很清晰。
gpt_image_2_skill — 2,102 Stars

GitHub:https://github.com/wuyoscar/gpt_image_2_skill | 作者:@wuyoscar
严格来说不只是一个 PPT 工具,而是围绕 OpenAI 的 gpt-image-2 模型搭了一套提示词画廊 + 提示词库 + 命令行工具。科研配图、海报、UI mockup、字体设计、地图——覆盖面很广。很多"图像驱动派"的 PPT Skill 底层调的就是 GPT Image 2,所以掌握这个工具等于拿到了上游的图像生成能力。
ppt-image-first — 799 Stars

GitHub:https://github.com/NyxTides/ppt-image-first | 作者:@NyxTides
项目名就是它的设计哲学:image-first。先让 AI 把每一页的视觉效果做到位,然后再在图的基础上配文字。在 Codex、Claude Code、OpenCode CLI 里都能跑。适合做内容卡片、社交媒体配图,或者那种"图比文字重要"的演示场景。
gpt-image2-ppt-skills — 557 Stars

GitHub:https://github.com/kevinnt05/gpt-image2-ppt-skills | 作者:@kevinnt05
和上面那个项目类似,也是基于 GPT Image 2 的图像驱动方案。区别在于这个更专注在 PPT 本身,对页面布局和内容结构的处理更精细。如果只想做 PPT 不需要其他图像生成能力,选这个更聚焦。
路线四:MCP 协议层
给大语言模型装上直接操控 PowerPoint 的能力——LLM 成了你的 PPT 设计师
open-slide — 1,700+ Stars

GitHub:https://github.com/1weiho/open-slide | 作者:@1weiho
通过 MCP(Model Context Protocol)协议,让大模型直接调用 PowerPoint 的底层 API。这意味着 LLM 不只是在"生成"幻灯片,而是在实时操控你的 PowerPoint 软件——插入文本框、调整形状、设置动画,操作粒度非常细。适合需要精确控制每个元素的进阶用户。
路线五:垂直场景专用
不为通用场景妥协——只为学术汇报等特定需求打磨
academic-slides — 260+ Stars

GitHub:https://github.com/leonardomso/academic-slides | 作者:@leonardomso
专门为学术汇报场景设计。论文里的公式怎么排版、参考文献怎么引用、数据图表怎么呈现——这些学术演示的痛点,通用 PPT 工具处理得都不好,而这个项目只为这一件事服务。如果你在读研读博,或者需要频繁做学术报告,这个比前面那些大而全的工具更实用。
路线六:综合设计平台
PPT 只是基本功——原型设计、UI 组件、设计系统全都能搞
OpenDesign — 40,800+ Stars


GitHub:https://github.com/chenguangming/OpenDesign | 作者:@chenguangming
这组里最大的项目,Star 数量直接碾压其他选手。它已经不只是一个 PPT 工具了——内置 72 套设计系统、31 个 Design Skill,覆盖原型设计、图片编辑、视频制作、UI 组件生成等一整套设计工作流。如果说前面那些项目是"给 AI 装上一个做 PPT 的插件",OpenDesign 更像是"给 AI 装上了一整个设计部门"。从 3 万 Star 飙到 4 万只用了几个月,增长势头非常猛。
怎么选?快速决策指南
根据我自己的实测体验,按场景给个快速建议:
• 正式演讲、投屏演示 → guizang-ppt-skill 或 html-ppt-skill(HTML 派视觉最好)
• 客户交付、需要可编辑 → ppt-master(原生 PPTX,每个元素都能改)
• 产品发布、数据总览 → apple-bento-grid(Apple 风 Bento 卡片)
• 咨询/商业汇报 → mckinsey-pptx(麦肯锡模板 + AI 辩护逻辑)
• 社交媒体内容卡片 → ppt-image-first(图片优先,视觉冲击力强)
• 学术报告/论文汇报 → academic-slides(专为学术场景打磨)
• 全栈设计需求 → OpenDesign(不止 PPT,原型/UI/视频全覆盖)
• 想自己深度掌控 → open-slide(MCP 协议,直接操作 PowerPoint)
最后说两句实话。
这些工具目前没有一个能完全替代人工设计师。它们擅长的是在"从零到七十分"这个区间里帮你快速过完,省下那两三个小时的排版时间。但如果你追求的是九十分以上的精细度,人工微调还是少不了的。
不过话说回来,这个赛道的迭代速度很快。几个月前大部分项目还只是能生成简单页面,现在已经有人在做动画、演讲者模式、模板智能推荐了。再过半年回头看,格局大概率又不一样。
以上均为个人实测体验,数据截至 2026 年 5 月
泪水打湿蛋炒饭KY · 效率工具观察