👆关注FlowmixAI,获取flowmix系列最新产品实践
作者简介:徐小夕,曾任职多家上市公司,多年架构经验。掘金社区签约作者,知乎专栏作家。打造过上亿用户规模的产品,聚集于AI应用的可持续落地。
写文档时,最崩溃的不是码字,而是找图。
最近我们在 JitWord 协同AI文档中偷偷添加了一个隐藏功能:只需要输入一下指令,就能一键生成各种风格的图片。
一、那个让我崩溃的下午
上周赶一份创意营销方案,写到"产品创意"章节时,我陷入了熟悉的焦虑:
打开图库网站,翻20分钟找不到合适的图片
用设计软件画,折腾1小时,效果还不如PPT
最后只能截图凑数,被小伙伴批"不够专业"
找图2小时,写文档30分钟——这种本末倒置的痛苦,相信我们都懂。
直到我们在 JitWord 里上线了一个隐藏功能:指令式文生图。
二、什么是"指令式文生图"?
简单说,就是在文档里直接打字,AI 帮你画图。
不需要切出文档、不需要打开设计软件、不需要学复杂的 Prompt 工程。像聊天一样描述你要什么,图就出现在光标所在的位置。

举个例子:
我在文档里输入:/image:生成一个航天飞行器的图片
回车,3秒后:

图直接嵌入文档,我可以继续码字,思路完全不打断。
三、为什么说这是"说人话"?
市面上的 AI 绘图工具,大多需要你用"咒语"——
"A clean and modern flowchart, blue gradient background, minimalist style, 4K resolution..."
JitWord 的指令式文生图,反其道而行:
核心差异:JitWord 懂你的上下文。

它知道你是在写技术文档、商业报告还是教学材料,生成的图会自动匹配场景——技术文档给架构图,商业报告给数据可视化,教学材料给示意图。
四、背后的技术思路(简单聊聊)
作为开发者,我简单拆解一下这个功能的设计逻辑:
1. 意图识别层 将用户的自然语言指令,解析为结构化的绘图需求(图表类型、数据维度、风格偏好)。
2. 上下文感知层 结合当前文档的类型、主题、已有内容,推断最合适的视觉表达方式。
3. 生成与适配层 调用多模态大模型生成图像,并自动调整尺寸、配色、分辨率,确保与文档无缝融合。
4. 嵌入式交互 生成结果直接插入编辑器,支持二次编辑(调整文字、替换颜色、修改布局)。
整个流程的优化目标只有一个:让创作者留在"心流"里,不被工具打断。
五、现在就能用
JitWord 的指令式文生图功能,已经随最新版本上线。
使用方式:
在文档编辑界面,输入 /image 你的需求 唤起指令面板
回车,等待3-5秒
图自动嵌入,继续写作
后续会持续扩展更多场景:
流程图、架构图、思维导图
数据可视化(柱状图、折线图、饼图)
示意图、概念图、原型图
UML图、甘特图、泳道图
写在最后
我们开发 JitWord 的初衷,是让文档创作回归内容本身。
指令式文生图不是炫技,而是解决一个真实的痛点:创作者的时间,应该花在思考上,而不是找图、画图、调格式上。
如果大家也受够了"写文档5分钟,配图2小时",试试这个功能。
说人话,AI 直接出图——这才是我们想要的智能文档。
JitWord,让创作更专注。
👇 点击阅读原文,立即体验指令式文生图