一个大家都心照不宣的场景
每一个做咨询的人,大概都经历过这样的深夜:群里最后一条未读消息,是某位合伙人发来的“这一页重写”,而你手边开着三个窗口——一个是大模型聊天框,一个是 Word 草稿,还有那个永远改不完的 Deck。
你在机器人里问一个问题,复制粘贴答案到 PPT,再用自己的经验和直觉,把那些“机器语”揉成客户听得懂的商业故事。
等到版本号从 v3 改到 v9,文件总算发出去了。但有一个细思极恐的事实是:这一整晚,你的 AI 什么都没学会,下次项目它仍然是一个什么都不知道的新实习生。
这其实就是今天大部分“AI+咨询”的真实状态:我们用 AI 做了很多“体力活”,却没有让组织本身变得更聪明、更快、更有记忆。项目结束,顾问累积了一点经验,PPT 躺进知识库,模型对这家客户、这个行业、这一套打法,依然毫无增长。
一、从 Prompt 到 Loop:咨询能不能自己“长经验”?
过去一年,一个很重要的概念开始在 AI 圈子里流行起来:Loop engineering。简单说,它不是在教你怎么“问得更巧妙”,而是教你如何搭一套循环系统,让 Agent 自己去找活、自己干活、自己检查、自己记账,每次循环都比上一次更聪明一点。

来源:Anthropic
在这个视角下,我们今天习惯的做法——顾问在聊天框里一问一答、手动挑选输出——更像是一种“人工 babysitting”。每一次新对话都是一次重开存档,模型对你上一页是怎么被合伙人打回重写的,完全没有记忆。Loop 的思路恰好相反:你只定义清晰的目标和边界,把“什么时候开始、做哪些步骤、怎么验收、怎么记录结果”,全部交给一个小系统去驱动,AI 在这个循环里边做事,边长经验。
如果把咨询公司看成一个整体的大 Agent,它也理应拥有这样的循环:不是“一个项目一条聊天记录”,而是“一个组织一套持续运转的 Loop”。项目越多,这套 Loop 越懂客户、越懂行业、越懂你们自己的风格,下一次介入就越快、越准,这就是我们说的“自进化的咨询组织”。
二、为什么现在的“QA 机器人咨询”,注定难以自进化?
回到我们每天在做的事:在机器人里问问题,把答案贴进 PPT,再用人脑做裁剪和润色。这个模式有几个天然的“断点”。
第一个断点是记忆断点。机器人看不到最终版本长什么样,更看不到“客户买单的版本”和“被打回的版本”的差别,所以它无法从中抽象出“什么是我们这家公司的写法、站位和判断”。所有真正的 know-how,都停留在人脑中、微信群里和那份最终的 PDF 里,模型下次还是要从零开始推理。
第二个断点是反馈断点。顾问的修改、客户的反馈、路演时的问答,本来是最宝贵的“标注数据”,却没有任何系统在系统性收集、整理和回写。我们做了大量一锤子买卖式的判断,但组织没有一套反向把这些判断沉淀到“可计算记忆”的机制。
第三个断点是责任断点。因为所有 AI 工作都被当作“临时小助手”,没有人真正对“这套助手随着时间变得更好还是更糟”负责。项目结束,聊天记录清空,一切重新开始。这样的 AI 使用方式,本质上是“租用一次算力”,而不是在培养一个会逐渐懂你的数字化伙伴。
如果我们希望咨询行业真的变得“AI 原生”,而不是“AI tool-enabled”,这三个断点必须被修复。
三、有记忆、会“做梦”的 Agent:把顾问的修改也放进闭环里
这时,Agent、记忆和“做梦”登场了。Anthropic 在部署 Managed Agents 时做了一件很有意思的事:让 Agent 在执行任务时,把关键信息、偏好和决策轨迹写进外部记忆;任务结束之后,再通过所谓的 dreaming 过程,抽取共性、合并重复、清理矛盾,形成一份更干净的“长期记忆”。
如果我们把这个思想迁移到咨询场景,就会发现一个很不一样的画面。项目在跑的时候,Agent 不只是回答“写一页行业趋势”这种问题,而是在背后悄悄记录:这个客户喜欢怎样的语气、哪些论据更容易被接受、什么样的结构在过会时最顺利。
顾问在最后一轮改稿中做出的删减和重写,也被当作“优选样本”写回记忆库。当项目告一段落,系统在后台“做梦”,逐页翻阅这些记忆和对话,把其中经常出现但质量很高的模式抽取出来,变成下一轮 Agent 的“默认风格”和“写作习惯”。
这样一来,每一次“合伙人说这一页不错”的背后,不只是当班顾问被表扬了,而是整个 AI 系统悄悄变聪明了一点。顾问的判断不再是烟花,而是被吸收到一个长期进化的咨询大脑里。这,就是从“用 AI 帮忙”到“与 AI 共同进化”的关键差别。
四、Skill 其实是普通顾问的“微型模型”,可以一点一点变强
很多读者已经体验过:同一个场景下,第一版写出来的 Skill 和迭代了几轮的版本,用起来的感觉完全不一样。前者容易跑偏、输出风格不稳定,后者几乎一跑一个准。这背后其实就是一个“微型强化学习”的过程:通过反复使用、纠错、微调指令,我们在真人 + 场景里给这个 Skill 打标签、做优化。
“可以后台问答我们的智能体,获得我们之前写过的5个基于咨询场景的Skills。
重要的是:Skill 是普通咨询顾问可以直接控制和改写的。你不需要动任何底层模型权重,也不需要懂复杂的 RL 算法,只要愿意把自己的套路、经验和偏好,一点一点写进 Skill 里,再用真实项目去验证和调整,它就会变得越来越像“你的第二大脑”。几版之后,你会发现,很多你已经熟练到下意识的判断,其实都已经被 Skill 捕捉和重用。
如果一家公司能让自己的顾问,持续维护和迭代各自的 Skill,并在团队内有版本管理、评审和共享机制,那这家公司其实已经在做一件事:让“顾问的经验”变成“组织的模型接口”,而且是可继承、可测量的接口。这就是自进化的雏形,只不过发生在 Skills 这一层,而不是在庞大的基础模型上。
五、从项目到 Loop:什么样的咨询公司算“AI 原生”?
如果我们把 Loop engineering 的思路拆开看,会发现它恰好和咨询公司的运作方式可以非常自然地对接:有自动化、有技能、有工具连接、有分工、有记忆。
在一个 AI 原生咨询组织里,一条典型的“Loop”可能是这样运转的。每周,系统自动扫描各个项目空间、客户数据和外部信息源,识别出需要更新的洞察、报告或风险提示。识别出来的任务,被分发给一组带着 Skills 的 Agent:有的负责搜集和整理材料,有的负责按照你们的行业框架起草,有的负责用你们内化的“合伙人评审标准”做初审。
整个过程中,Agent 不断把“哪些改稿被保留”、“客户反馈了什么”、“哪一页在内部评审时争议最大”写入记忆。项目结束时,系统在后台“做梦”,把这些零散的事件整合成更高一层的经验:哪些结构更适合某类董事会,哪种论证路径更容易在监管面前站得住脚,哪种写作方式在不同文化背景里反应最好。
“可能这个自进化对于企业内部的作用会比对于客户的作用更大一些。
顾问的角色,也随之发生了变化。初级顾问不再主要是“拼体力熬夜改 PPT”,而是学习如何与这些 Loop 合作;中高级顾问不再只盯着单个项目,而是开始对某一条 Loop 和一组 Skills 负长期责任,像产品经理一样打磨它们;合伙人不再只看项目 GM,而是要问:我们有哪些 Loop 是在持续变强的,它们为整个组织带来了多少可复用的能力和收入。
当一个咨询公司里,项目只是这套系统的输入和试验场,而 Loop、Skills 和 Memory 才是真正的资产,我们就可以说,这是一家“会自己进化的 AI 原生咨询组织”。
六、结尾
写到这里,其实我最想说的是:Loop、Agent、Skills、记忆、做梦这些词听上去很技术,但它们背后要解决的,其实是一个很简单的问题——我们愿不愿意让组织变得比我们个人更聪明,愿不愿意让今天的每一页修改,都为明天的每一个项目积累一点额外的智慧。
我们正在做就是和我们的客户,一起从具体项目出发,把这套“AI 原生咨询 Loop”真正搭起来:不是再多一个大模型账号,而是帮助企业搭好自己的循环系统,让它在实战中不断变强。如果你也在思考团队的生产方式、交付模型,甚至整个咨询事业该如何升级,欢迎用真实的问题、真实的数据、真实的业务场景,和我们一起把这条路走出来。
如果你希望成为这批“AI 原生咨询实践者”中的一员,或者希望把你所在的团队,悄悄升级成一支会自我进化的咨询组织,可以直接把你的简单介绍和目前面临的问题,发到我们的邮箱:contact-growth@proton.me。收到之后,我们会优先从那些“问题清晰、愿意一起迭代 Loop 的团队”开始,和你一起设计第一条属于你们自己的 AI 咨询闭环。
