AI 生成「真 PPT」的硬核工具:丢进任意文档,拿回可逐字编辑的 PPTX
作者: 秋哥 | 语言: Python / SVG | ⭐: 待查
🔗 https://github.com/hugohe3/ppt-master
一句话总结:PPT Master 不是又一个套模板的在线工具,而是一套运行在 AI IDE 里的工作流——它把 PDF、网页、Markdown 甚至聊天记录,变成能在 PowerPoint 里逐元素修改的 .pptx。
◆ 项目速览 ◆
•项目名称:hugohe3/ppt-master
•核心定位:AI 驱动的原生可编辑 PPTX 生成系统
•推荐模型:Claude(~100 万 token 上下文)+ gpt-image-2
•支持 IDE:Claude Code、Cursor、VS Code + Copilot、Codebuddy
•支持模型:Claude、GPT、Gemini、Kimi
•授权协议:MIT(免费可商用)
•数据安全:全流程本地运行,源文件不上传第三方服务器
01 为什么值得关注
市面上的 AI PPT 工具大致分四类:
| | |
|---|
| | |
| | |
| | |
| **真 DrawingML 形状、文本框、图表** | |
PPT Master 最大的差异化就是:它输出的是真正的 PowerPoint。这意味着:
•打开后每个文本框、每个形状、每张图都能直接修改
•保留 PPT 原生的转场、入场动画
•演讲者备注可以合成为音频旁白
•可以继续套用你自己的企业模板
作者何雨果(Hugo He)本身从事投融资工作,注册会计师、资产评估师、咨询工程师,工作中常年审阅和修改 PPT。他做这个项目的原因很直接:"AI 生成的幻灯片应该能在 PowerPoint 里继续编辑,而不是被压成一张张图。"
02 核心功能详解
1. 任意文档输入
支持把以下材料直接转成 PPT:
•PDF:论文、报告、招股书
•DOCX:Word 文档、方案书
•EPUB:电子书
•URL:网页、博客、新闻
•Markdown:笔记、文档
•纯文本 / 聊天记录:甚至一段对话就能生成 deck
2. 六种预设设计风格
PPT Master 内置了完整的视觉风格系统,不是简单的换色:
3. 原生 PPTX 输出
这是 PPT Master 的技术核心。它通过 SVG 作为中间格式,再转换为 PowerPoint 原生的 DrawingML:
•文本是真正的文本框,不是图片上的字
•图表是真正的图表对象
•形状是真正的可编辑形状
•支持渐变、阴影、复杂排版
4. 音频旁白与演讲者备注
•每页自动生成演讲者备注
•可将备注合成为逐页音频旁白
•在 PowerPoint 里播放时,每页自动"读"给你听
5. 多角色协作工作流
PPT Master 把一个 deck 的生成拆成多个专业角色:
Source Document → Create Project → Template → Strategist → Image Generator → Executor → Quality Check → Post-processing → Export
•Strategist:负责内容结构、视觉策略
•Image Generator:调用 AI 生图
•Executor:逐页手写 SVG
•Quality Checker:视觉自检
03 适用场景与人群
04 使用注意事项
1. 模型决定上限
PPT Master 是 harness,不是完整 agent。工具负责工作流,模型决定产出质量。官方推荐组合:
•Claude(~100 万 token 上下文窗口)
•gpt-image-2 用于生成配图
用便宜模型能跑通流程,但成品可能需要大量人工修补。
2. 需要 AI IDE 环境
它不是一个网页应用,而是运行在 AI IDE(Claude Code / Cursor 等)里的 skill。你需要:
•安装 Python 3.10+
•安装 AI IDE
•配置好模型 API
3. 本地依赖较多
为了处理 PDF、Word、Excel、网页、SVG 转 PPTX、AI 生图等,项目依赖不少:
•python-pptx、PyMuPDF、mammoth、markdownify
•svglib / reportlab、Pillow、numpy
•edge-tts、google-genai、curl_cffi、flask
4. 不要期待一次完美
作者反复强调:"模型越便宜,要补的人工就越多。成品好不好,最终取决于你操作这个项目和 PPT 的能力。"
05 费用与授权评估
•代码本身:MIT 协议,免费可商用 ✅
•工具订阅费:无 ✅
•实际成本:AI 模型调用费用(按量计费)⚠️
•推荐模型成本:Claude Opus / gpt-image-2 属于较贵模型,复杂 deck 可能花费数美元
•隐藏费用:如果使用第三方 API 中转站,需按平台计费
•商用风险:低,但生成内容需自行审核版权与合规性
06 快速上手
1. 克隆仓库
git clone https://github.com/hugohe3/ppt-master.git cd ppt-master
2. 安装依赖
pip install -r skills/ppt-master/requirements.txt
3. 在 AI IDE 中加载 Skill
•Claude Code:把 skills/ppt-master/ 放到项目或用户 skills 目录
•Kimi Code CLI:已配置到 extra_skill_dirs
4. 开始生成
对 AI 说:
"用这份 PDF 做一份杂志风格的 PPT"
AI 会按工作流自动完成:文档解析 → 策略制定 → 图片生成 → SVG 绘制 → PPTX 导出。
写在最后
PPT Master 的价值不在于"一键出片",而在于它把 AI 生成内容从"不可编辑的图片"拉回到了"可继续打磨的源文件"。
它适合这些人:
•愿意花 20% 的时间让 AI 完成 80% 的枯燥工作
•熟悉或愿意学习 AI IDE 工作流
•对 PPT 有继续修改、品牌统一的需求
如果你只是偶尔做一页简单 PPT,市面上的模板工具可能更快;但如果你经常需要把长文档、论文、报告变成可演示、可编辑的 deck,PPT Master 是目前少有的"真 PPT"解决方案。
🔗 https://github.com/hugohe3/ppt-master