故事是这样的。
前两天老板突然丢了一份30页的PDF过来,说「这个内容不错,你帮我做个PPT,明天要用」。
我当时就愣住了。
30页PDF,转PPT?你想想看,要一页一页拆内容,找模板,调排版,加动画,导出,预览,再改。这种活以前怎么也得干一整天。
但这次不一样。
我打开Claude Code,把PDF丢进去,说了一句话,「帮我把这个转换成PPT」。
十分钟后,一份20页的PPTX就躺在桌面上了。不是那种每页一张图片的假PPT,是真正的原生PPTX,文字框可以编辑,图表可以改数据,形状可以拖动,动画可以调整。
你品品这个效果。
而帮我做到这一切的,就是一个叫PPT Master的Claude Code技能。GitHub上29000多星,MIT协议开源,完全免费。
坦率的讲,这是我今年用过最离谱的效率工具之一。
这玩意到底是啥
很多朋友可能不知道PPT Master是什么。简单说,它不是一个独立的软件,而是一个运行在AI IDE里的工作流。
你平时用Claude Code写代码对吧,PPT Master就是装在Claude Code里的一个技能。你跟它说「帮我做个关于XXX的PPT」,它就会自动帮你完成从内容分析到PPT导出的全流程。
支持的IDE不止Claude Code,Cursor、VS Code加Copilot、Codebuddy都能用。支持的AI模型也不止Claude,GPT、Gemini、Kimi、DeepSeek都行。
说到这里,你可能会问,市面上AI做PPT的工具不是一抓一大把吗,Gamma、美图AI、WPS AI,哪个不能做?
问题就在这。
市面上的AI PPT工具,到底差在哪
我是真的研究过这块。
市面上的AI PPT工具大致分四类,
第一类,模板填充型。给你一个固定模板,AI往里面填文字。能用,但千篇一律,改起来还特别麻烦。
第二类,图片导出型。每一页就是一张大图,塞进PPTX文件里。看起来挺好看,但你没法改。想改个字?重新生成吧。
第三类,网页演示型。生成的是HTML幻灯片,压根不是PPTX文件。拿去开会?领导的电脑打不开。
第四类,原生PPTX型。每一页都是真正的文字框、真正的矢量形状、真正的图表,打开就能编辑。
PPT Master做的是第四类。
说实话,这个差距比你想象的大得多。图片型的PPT看着能用,但一旦需要修改,你就傻眼了。而原生PPTX不一样,你可以直接在PowerPoint里改文字、调颜色、加页、删页,跟手动做的PPT一模一样。
这就是PPT Master的核心价值,它输出的不是「看起来像PPT的东西」,它输出的就是PPT。
它是怎么做到的
这块需要稍微聊一下技术原理,但我会说人话。
PPT Master的工作流分7步,但它用了两个关键角色来协作,一个叫Strategist,一个叫Executor。
Strategist负责设计策划。它会分析你的源文档,然后跟你确认8个关键参数,画布格式、页数范围、目标受众、风格目标、配色方案、图标使用、排版方案、图片使用。确认完之后,它会输出一份设计文档。
Executor负责执行。它按照设计文档,一页一页地生成SVG页面,然后把SVG转换成原生PPTX。
为什么要经过SVG这一步?
因为SVG是矢量格式,精度高,渲染稳定,转成PPTX之后每个元素都是独立可编辑的。如果直接从Markdown跳到PPTX,很多排版细节会丢失。
这个设计挺巧妙的。
支持哪些源文档格式
这块我觉得是PPT Master最实用的地方之一。
它支持的源文档格式非常广,PDF、DOCX、Word、Excel、PPTX、EPUB、HTML、LaTeX、Markdown,甚至网页链接和微信公众号文章都能直接转。
每种格式都有对应的转换脚本,比如PDF用pdf_to_md.py,DOCX用doc_to_md.py,网页用web_to_md.py。
你不需要手动把内容复制出来,直接把文件丢给它就行。
画布格式,不只是16:9
这个点我觉得很多人会忽略。
PPT Master支持8种画布格式,不只是传统的16:9和4:3。
PPT 16:9(1280×720),商务演示、会议,默认推荐。
PPT 4:3(1024×768),传统投影仪、学术答辩。
小红书(1242×1660),图文分享、知识帖子。
微信朋友圈/IG(1080×1080),方形海报、品牌展示。
故事/抖音(1080×1920),竖版故事、短视频封面。
微信文章头图(900×383),公众号封面。
宽幅Banner(1920×1080),网页横幅、数字屏幕。
A4打印(1240×1754),打印海报、传单。
你品品这个覆盖面。不光能做PPT,还能做小红书封面、朋友圈海报、公众号头图。
图片生成,14种后端随便选
PPT Master内置了图片生成能力,而且后端特别多。
默认用Gemini,推荐这个,效果最好。也支持OpenAI兼容后端、SiliconFlow硅基流动、火山引擎、智谱AI、通义千问,加起来14种以上。
在.env文件里设一下就行,
IMAGE_BACKEND=gemini
GOOGLE_API_KEY=你的key
如果生成的图片有水印,还有个去水印脚本,python3 scripts/gemini_watermark_remover.py <图片路径>
这个细节挺贴心的。
动画和旁白,不只是静态PPT
很多人可能不知道,PPT Master还支持动画和旁白。
动画方面,支持fade、push、wipe、split、strips、cover、random等多种过渡效果,入场动画可以设为mixed混合模式,触发方式支持点击后、与上一动画同时、上一动画之后。
旁白方面,支持Edge TTS(免费)、ElevenLabs、MiniMax、通义千问、CosyVoice等多种语音引擎。
你品品,你不仅能做出一份PPT,还能做出一份带动画、带旁白的演示视频。
太猛了吧。
安装教程,手把手教你
这块是重点,我尽量说得详细。
第一步,安装Python
需要Python 3.10以上版本。
Windows用户去python.org下载安装包,安装的时候记得勾选「Add to PATH」。
macOS用户,brew install python
Ubuntu/Debian用户,sudo apt install python3 python3-pip
第二步,安装依赖
pip install -r requirements.txt
核心依赖包括python-pptx(PPTX生成)、CairoSVG(SVG转PNG)、PyMuPDF(PDF解析)、Pillow(图片处理)、edge-tts(语音生成)等。
macOS如果CairoSVG安装失败,需要先装cairo,brew install cairo
Ubuntu如果失败,sudo apt install libcairo2-dev
第三步,安装AI IDE
推荐Claude Code,体验最好。Cursor和VS Code加Copilot也行。
第四步,配置图片生成(可选)
如果需要AI生成图片,在项目根目录创建.env文件,
IMAGE_BACKEND=gemini
GOOGLE_API_KEY=你的key
不配置也能用,只是没有AI配图。
第五步,开始使用
在Claude Code里直接说,
「帮我做一个关于XXX的PPT」
或者提供源文件,
「把这份文档转换成PPT,<文件路径>」
Claude Code会自动执行全流程,源文档处理、项目创建、设计确认、SVG生成、PPTX导出。
我实测踩过的坑
说实话,PPT Master不是那种「一键出成品」的工具。
第一个坑,模型选择很重要。用便宜的模型,生成质量会差很多,排版可能歪歪扭扭的。推荐用Claude Sonnet或者GPT-4o,效果明显好于小模型。
第二个坑,SVG质量检查必须跑。每页生成完之后,它会自动跑svg_quality_checker.py,有error必须修复,有warning方便的话也修一下。不检查直接导出,可能会有各种小问题。
第三个坑,源文档质量影响很大。如果PDF是扫描件或者格式很乱,转出来的Markdown可能丢内容。建议先检查一下中间产物,确认内容完整再继续。
第四个坑,导出三步必须按顺序来。先分割讲者备注,再SVG后处理,最后导出PPTX。不能跳步,也不能合并执行。
但说实话,这些坑比起手动做PPT的工作量,真的不算什么。
跟其他AI PPT工具对比
我测过Gamma、美图AI、WPS AI、iSlide AI,简单说一下感受。
Gamma,生成速度快,模板好看,但输出是网页格式,不是真正的PPTX。导出成PPTX之后格式经常错乱。
美图AI,图片质量高,但模板类型有限,商务场景不太够用。
WPS AI,集成在WPS里方便,但生成的PPT编辑自由度低,很多元素是锁定的。
iSlide AI,素材库丰富,但AI生成能力弱,更多是辅助排版。
PPT Master,输出原生PPTX,每个元素都能编辑,支持14种图片后端,支持动画和旁白。缺点是需要装环境,有一定学习成本。
怎么说呢,如果你只是偶尔做个简单PPT,Gamma够用。但如果你经常需要做高质量的、可编辑的演示文稿,PPT Master是目前最好的选择。
这个项目背后的人
PPT Master的作者叫Hugo He,GitHub上hugohe3。
说实话,29000多星,MIT协议开源,这个数据说明一切。
项目创建于2025年12月,到现在半年多,一直在活跃更新,最新版本是v2.10.0。
还有一个学术分支版本,叫ppt-master-sci-fork,加了MinerU文档解析和SVG公式渲染,专门针对论文和技术文档优化。如果你是做学术的,可以看看这个分支。
写到这里
你可能会问,这东西学起来难不难?
坦率的讲,如果你有Python基础,半小时就能上手。如果你完全没碰过代码,可能需要花一两个小时熟悉环境。
但这个学习曲线是值得的。
因为PPT Master做的不只是「帮你做个PPT」,它展示的是一种新的工作方式,用AI Agent来处理繁琐的文档转换工作。这种能力越早掌握,以后越省事。
GitHub地址,https://github.com/hugohe3/ppt-master
如果你想获取完整的安装脚本和配置模板,扫码加我微信,我整理了一份PPT Master快速上手包,包括常用画布格式的模板、图片生成后端的配置示例、以及我踩坑总结的避坑清单。
