当前位置：首页>PPT>扒一扒PPT Agent的这两个新能力,思路分享第二弹!

扒一扒PPT Agent的这两个新能力,思路分享第二弹!

2026-04-04 07:19:33

三顿发布PPT Agent后，有很多小伙伴留言说，他们做PPT，很多时候是已经有了整理好的资料或是思路，能不能按已有内容生成？

说实话，这个问题狠狠地戳中了我。我们做AI工具，不就是为了解决大家最真实、最迫切的需求吗？如果AI只能从0到1，却无法在我们已有的基础上“添砖加瓦”，那它的价值，至少要打个对折。

那我们火速做了支持和优化：

https://sandun.cc/

现在可以上传PDF资料，比如一篇论文：

全是英文看着都头大？直接帮你转换为PPT。

可以直接引用论文内的公式、图片：

除了论文外，各种年报、资料也可以直接转换为PPT：

甚至，是可以直接传一个需求文档，标注好每页想要的内容：

直接帮你生成。

这篇文章，我想把我们死磕这个功能背后的完整思路，毫无保留地分享给你。这不仅是一个功能介绍，更是一次解决问题的真实旅程，希望能给你带来一些启发。

1.把PDF解析出来。

先来跟大家聊聊怎么把PDF转成PPT。

这事听起来简单，但其实有个关键前提。就像我们需要借助工具才能在电脑上看PDF，AI也一样，我们必须先把PDF“转换”成它能理解的文本。

用OCR就能搞定。因为是商业项目，要考虑到并发需求，三顿用的是智谱的GLM-OCR。那如果是自己用，我非常推荐百度的PaddleOCR，这是百度少有的良心项目了。

你可以直接在这里用：

https://aistudio.baidu.com/paddleocr

API场景下每天也赠送大量的额度，完全够用：

2.搞定内容大纲。

接下来就可以把解析出来的文本，转换成可视化的大纲。如果你用的是三顿的Agent，这步可以直接搞定。

同样是为你生成便签化的大纲，呈现更清晰，位置也能自由调：

如果你想自己整理，分享一个我之前用的提示词，可以直接帮你把PDF解析成JSON格式的大纲。

你是一名写作专家，充分了解二八法则，能审视论证、逻辑和观点，提出深入问题和见解。请你以为我总结文档内容，并转换成JSON代码块的形式输出，请包括至少5个分支主题。同时，请为每个分支主题添加至少3个子主题。格式请严格参考示例："title": "网络安全大赛", "catalogs": [ { "catalog": "技术的特性", "sub_catalog": [ "创新的技术形式", "高效率和高可塑性", "对现实世界的影响" ] }, { "catalog": "带来的革命", "sub_catalog": [ "AIGC的应用场景和趋势", "赋能生产、释放创造力的影响", "对企业创新的推动作用" ] }, { "catalog": "挑战与机遇", "sub_catalog": [ "AIGC发展中的问题与挑战", "创新驱动发展的机遇", "适应新时代的策略和措施" ] }, { "catalog": "人工智能的融合", "sub_catalog": [ "人工智能的互补关系", "人工智能在行业应用中的联合发展", "和人工智能共同演进的趋势和影响" ] }, { "catalog": "前景展望", "sub_catalog": [ "未来发展的可能性和方向", "数字经济时代的角色和价值", "对人类社会发展的影响和意义" ] }在此过程中不要输出任何无关markdown语法的内容。之后的对话都按此要求进行。我的文章内容是：

3.映射PDF材料。

这个是想跟大家分享的重点。一份PDF里内容那么多，怎么才能精准地把它分发到PPT的每一个对应页面里去呢？

这里有个巧妙的思路。像PaddleOCR这类工具解析PDF时，有个巨大的好处：它会把你的PDF拆分成一个个独立的“内容块”。

于是，我们要做的，就变成了一个非常简单的“填字游戏”。

每个便签（内容页）的主题是已经固定下来的，你只需要把解析出来的内容块塞到对应的页面去。

这事也不用你自己来做，你可以在前面那个大纲提示词的基础上优化下，类似这样。

你擅长从长文档（PDF/Report）中提取核心逻辑，重组为演示文稿大纲，并能精准地将文档中的证据（Text/Image）挂载到对应的 PPT 页面上。## Goals基于提供的 **PDF文档解析数据 (Parsed Layout Data)** 和 **用户主题**，构建一份逻辑严密的 PPT 大纲。**关键任务**：不仅要生成标题，还要从文档中“摘录”出支持该页面的核心素材。## Input Format (Layout Analysis Data)你将接收到一个 JSON 列表，代表文档的版面分析结果。示例结构：[  {"index": 1, "label": "text", "content": "2024年营收增长25%..."},   {"index": 2, "label": "image", "content": "https://oss.../chart.png", "bbox": [...]},  ...]请你在生成大纲的同时，将PDF内容填入对应的页面中，支持重复使用。