脱敏不是把字段删空,而是在不暴露真实对象的前提下,保留可分析的业务关系。
很多人已经知道,经营材料不能直接丢给 AI。
但真正开始操作时,很容易变成两个方向:
一种是把敏感字段都删掉。
另一种是随手把几个名字改掉。
前者的问题是,AI 失去了业务关系,只能看到一堆孤立数字。
后者的问题是,同一个客户、项目、负责人,在不同文件里可能被改成不同代号,后续核对会变得更乱。
所以在把 Excel、Word、经营分析材料交给 AI 之前,我更建议先做一张脱敏替换表。
脱敏不是删字段。
客户名称不能上传,不代表整列客户信息都要删除。
项目名称不能上传,不代表项目之间的关系也要消失。
负责人姓名不能上传,不代表责任角色完全不能保留。
金额不能原样上传,也不代表所有数字都要清空。
脱敏的目标,不是让材料变成没有信息量,而是在不暴露真实对象的前提下,保留足够的业务结构。
如果删得太干净,AI 后面就很难做整理、核对、归类和差异提示。
更好的做法,是先做一张替换表。
把真实对象变成稳定代号。
同一个客户,在所有文件里都叫客户A。
同一个项目,在所有文件里都叫项目P。
同一个负责人,在所有文件里都叫负责人1。
这样 AI 虽然不知道真实身份,但仍然能看懂不同材料之间的关系。
最简单的替换表,可以先有五列:
这张表的关键不是复杂,而是一致。
先有规则,再做材料。
这里有一个很重要的边界:
完整映射关系,要留在自己手里。
也就是说,你可以给 AI 看已经替换后的经营材料。
但不要把“客户A=某某公司”“负责人1=某某人”“项目P=某真实项目”的完整对照表一起上传。
AI 可以帮助你整理脱敏版材料。
AI 可以帮你检查代号是否前后一致。
AI 也可以帮你标出疑似未脱敏字段。
但真实映射关系,应当留在本地或内部安全位置,由人管理。
金额是经营分析里最容易处理过头的部分。
如果所有金额都删除,AI 很难判断哪个问题影响大,哪个只是局部波动。
如果所有金额都原样保留,又可能暴露预算、毛利、价格、合同等敏感信息。
一个折中的做法是:
这样做的目的,是让 AI 仍然能判断趋势和优先级,但不直接看到真实数字。
当你已经做出一份脱敏版材料,可以让 AI 做一次检查,而不是让它还原身份。
可以这样提问:
请只检查这份脱敏版经营材料。
帮我标出三类问题:
- 因脱敏过度导致无法理解的字段。
不要还原真实对象,不要推测真实公司、人员和项目。
只输出需要人工复核的位置和原因。
这个提示词的重点,是把 AI 的角色限制在“检查脱敏版材料”上。
它不是替你判断哪些资料能不能外发,也不是替你保管原始映射关系。
如果刚开始做脱敏流程,不建议一上来就处理照片和截图。
更适合的第一步,是从 Excel 和 Word 开始。
Excel 里,先复制一份脱敏版,再按替换表处理客户、供应商、人员、项目、区域和金额字段。
Word 里,不只要改正文,还要检查表格、批注、页眉页脚、文件名和附件说明。
先把这两类文件跑顺,再考虑是否需要做更自动化的替换脚本。
照片和截图不是不能处理。
只是它们通常会额外增加工作量。
比如先遮挡或裁切敏感区域,再确认 OCR 有没有识别错,还要复核图片里是否残留人名、客户名、项目名、金额等信息。
所以如果只是想建立一个可复用的脱敏流程,先从 Excel 和 Word 开始,会更稳。
给 AI 看经营材料前,先做一张脱敏替换表。
这张表不需要一开始就很复杂。
它至少要回答四件事:
哪些字段要替换?
替换成什么规则?
哪些业务口径要保留?
真实映射关系放在哪里,不交给 AI?
脱敏不是为了让材料看起来安全,而是为了在不暴露真实信息的前提下,保留可分析的业务关系。
客户、项目、人员,可以变成稳定代号。
金额、毛利、目标,可以保留区间、比例和方向。
真实映射关系,留在自己手里,不交给 AI。
AI 看代号。
人留映射。
这才是更稳的开始。