最近需要做答辩的 PPT 了,恰巧在网上看到一位博主分享的实操,于是实践了下并做了一些拓展。 本文记录下我的实践过程以及拓展思路
环境: codex 原始数据: 论文.pdf + 学校 logo.png + 论文答辩 PPT(可选)
这篇博客 提供的 workflow和 prompt 整体思路、注意事项以及操作方式都比较清晰。如果只是想快速上手,直接参考原文即可。 不过在实际使用过程中,我发现这种方式仍然存在两个问题:
针对上述问题,我主要做了两个拓展:
ℹ️- 这一部分主要是我对 `/goal` 的一些理解。如果只关注具体操作流程,可以直接跳到下一节。
经常 vibe coding 的朋友肯定会有这么一个感觉,就是 AI 时代注意力变得越来越稀缺,当你打开多个终端窗口时,你的效率因为频繁的上下文切换反而会变得更低,而且会让你变得很痛苦......而且总是会陷入garbage in garbage out的死循环 因此,一个比较理想的工作方式是:尽可能让 agent 在一次任务中连续完成更多步骤,而不是每完成一步就停下来等待人工确认。 ,或者说可以让我减少上下文切换的次数,对于一个完整的工程,上下文切换是无法避免的(不可能一次性,完美的完成任务,除非任务极其简单),也就是说这部分成本是无法避免的,此时我们可以使用摊销(amortize),就像进程切换时,上下文切换的成本是固定的,此时通过提高 time slice 就可以让这些固定成本看起来没那么多 按照这个思路, 提高 AI 应用效率的办法是尽可能让每次工作时间足够长, codex 推出的/goal 就是这方面的一个实践,我比较认可的最佳实践是党哥提到的goal driven其实这套机制的核心在于是否能提出足够清晰的目标和足够准确的验证标准(test case),否则就像无头苍蝇,永远需要人干预.
下面是/goal 在制作答辩 PPT 上的实践
由于 codex 不会自动推荐主动的子代理,但是他有plan 模式,我们可以先让他识别出哪些地方是不明确的,是要我提前说明的,在对话框中打开 plan 模式并输入下面的 prompt
我想参考下面的这篇博客制作我的毕业论文答辩ppt, "https://blog.csdn.net/2201_75420345/article/details/160890409"
,你根据这个博客先列出一个制作的计划,并在可能需要我确认地方让我选择确认(比如视觉方案),确保整个执行过程不会停止
在这个过程中他会识别出哪些地方需要我确认,并向我提问确认我确认完这些问题后,Codex 生成了一份较完整的制作计划。这个计划中不仅包含 PPT 的结构安排,还包含实施步骤和测试验收标准。
ℹ️- 生成的计划
参考博客流程,采用“先提炼结构、再确定视觉、最后生成整页图片式 PPT”的方式制作答辩稿。最终目标是生成一份适合 6-8 分钟本科答辩、约 16 页、蓝白工程风、整页图片铺满且带演讲者备注 的 PPT。
毕业答辩 中的系统截图、架构图、专题图和 logo。毕业设计/答辩PPT/,内部放置结构稿、视觉参考图、页面图片、PPTX 输出文件和备注稿。答辩PPT结构.md,每页包含标题、核心观点、建议图示和备注要点。毕业设计/答辩PPT/我们会发现,在计划的最后,明确写了测试与验收,这部分就是 goal 的 testcase,点击执行之后,就会生成对应的 PPT
从最终效果来看,这种方式比一步步手动提示更高效,也更适合处理 “目标清楚但步骤较多” 的任务。
上述操作生成的 PPT 属于AI 图像生成派,生成的 PPT 是不可编辑的,每一页是纯图片的形式,博客作者也提到这样做的好处但缺点也很明显,就是一旦有细小的改动,就需要让 AI 重新生成一次,改动成本太大,阅读了这个公众号文章后,了解到 PPT Master 就是专门用于制作可编辑 PPT的,于是结合此项目和 codex,重构了一幅可编辑的答辩 PPT(这篇文章关于AI制作PPT总结的很全,推荐阅读!)
Prompt:
很好!现在这个ppt已经很不错了,接下来使用这个开源项目将这个ppt转换为可编辑的"https://github.com/hugohe3/ppt-master",新增一个ppt文件
总结一下,我认为比较合理的工作流是:
这种方式兼顾了 AI 生成的效率和正式答辩场景下的可维护性。