好家伙,Paper2Any 这个项目,东哥第一眼看完有点没绷住。
它干的事很直白:论文 PDF、截图、文字,直接丢进去,后面自动拆内容,生成模型架构图、技术路线图、实验图、PPT 演示稿,甚至学术海报、视频脚本。不是那种只给你总结三段话的论文助手,而是奔着“汇报材料”去的。项目 README 里写的核心也是 paper multimodal workflow,从论文到可编辑科研素材。
这里最戳人的点,是“可编辑”。
生成 PPTX 后还能继续改;论文里的图片、截图,也能转成 DrawIO 这类可编辑流程图;不满意还可以对话式改图。东哥以前最烦的就是论文图扒下来以后变成死图,箭头歪了、模块名要改、颜色不统一,最后还得自己重画一遍。Paper2Any 这块如果能稳住,省的就是最脏最碎的时间。
它也不只做 PPT。Paper2Rebuttal 可以帮你起草审稿回复,Paper2Citation 能追引用关系,知识库还能做语义检索,再往 PPT、播客、思维导图这些方向接。说真的,实验室里准备组会、开题、中期汇报,很多时间不是花在“想法”上,是花在截图、排版、改图、补引用这种活儿上。这个项目瞄的就是这堆杂活。
部署上官方给了 Docker 路线,git clone 后配 .env,还有 simple / advanced 两套配置。东哥看到这种一键部署,第一反应不是酷不酷,而是环境变量怎么管、模型 key 放哪、文件会不会堆爆、失败任务有没有日志。尤其它还带知识库和生成工作流,真拿去给课题组用,权限、额度、存储路径别随手默认到底。
目前项目 GitHub 上 2.5k star,最近还在更新 editable PPT workflow,把大纲生成、画布编辑、图库预览、论文图片插入这些东西揉到一起。正在赶论文、做学术汇报、或者平时被 PPT 折腾到头大的同学,可以去看一眼。