【导读】 最近,你是不是也感觉Kimi、MiniMax这些AI工具越来越难用了?花199元买的套餐,高峰时段却卡成PPT,任务动不动就中断。这背后,是一场席卷整个AI行业的“算力饥荒”。Agent(智能体)的爆发,让算力需求呈百倍增长,而依赖“租用”算力的轻资产模式瞬间被击穿。云厂商开始涨价,AI公司陷入两难。我们曾经以为唾手可得的“智能白菜价”,其窗口期可能比想象中短得多。
朋友们,最近我被AI搞得有点烦。
不是它不够聪明,而是它经常“没力气”干活。我指的是Kimi、MiniMax这些国产大模型。就像上周,我开了个Kimi的Allegretto套餐,199块一个月,心想试试它的智能体(Agent)到底多能打,能不能帮我自动处理些数据、写写报告。
结果呢?理想很丰满,现实很骨感。任务跑到一半,经常弹出“高峰时段算力不足”,然后Agent就呆住了,像个没睡醒的实习生。MiniMax那边也差不多,部署个“数字员工”,聊两句就掉线,API限速警告比我的工作提醒还频繁。
这感觉,就像你花钱买了张高级自助餐券,结果每次去都要排长队,还不一定能吃到招牌菜。
翻翻用户群,全是吐槽。有哥们儿@客服说:“今天掉线五次了,聊两句就断。”客服的回复堪称经典:“建议您检查本地网络。”气得用户直接贴了张“赛博牛马”表情包。说实话,这场景我们IT男太熟了,服务器扛不住压力的时候,第一反应就是“甩锅”给网络。
但问题真的在“网络”吗?不,问题的核心是,整个AI行业正在经历一场“消化不了”的算力盛宴。
从“聊天”到“打工”,AI的胃口变了
以前的AI,比如经典的Chatbot,就像个有问必答的客服。你问一句,它答一句,算力消耗是线性的,可预测。好比餐厅服务员,这桌点完菜就去下一桌,效率很高。
但现在火热的Agent(智能体),完全不是一回事。它更像一个真正的“数字员工”。你给它一个任务,比如“分析本季度销售数据并写份报告”,它会自己规划步骤(先找数据,再分析趋势,最后起草)、调用工具(连接数据库、运行分析软件)、执行操作,甚至还会反思和纠错。
这个过程,每一步都需要调用大模型“思考”一下,消耗的算力资源(以Token计)是指数级上升。
有数据估算,完成一个中等复杂的Agent任务,消耗的算力可能是简单问答的几十倍到上百倍。极端情况下,甚至有开发者记录到一次任务“烧掉”了相当于数百万次对话的算力。这就好比,原来的服务员只需要端菜,现在的服务员得从买菜、洗菜、切菜、炒菜到端上桌全程包办,还得思考菜谱合不合理。一个服务员,现在只能服务一桌客人了。
德勤(Deloitte)的一份研究报告指出了一个悖论:过去两年,AI处理每个Token的成本下降了280倍,但企业的AI总开支却飙升了——因为总需求暴涨了成千上万倍。价格是便宜了,但架不住你用量翻了天啊!
“租来的算力”不香了:AI公司的“无根之木”
那么,面对暴涨的需求,Kimi、MiniMax们为什么不赶紧多买点服务器(GPU)呢?
这就是问题的关键:它们自己,几乎没有服务器。
和自建庞大数据中心的OpenAI不同,国内很多明星AI公司走的是“轻资产”模式。它们的算力,几乎全部从阿里云、腾讯云、火山引擎这些云服务商那里“租”来的。早期,这模式很香,不用背负沉重的硬件投资,灵活又省钱,云厂商之间为了抢客户还大打价格战。
但Agent的爆发,让“租借”模式的脆弱性暴露无遗。当所有AI公司都急需算力时,云厂商自己的资源池也捉襟见肘。用户在骂Kimi卡顿的时候,Kimi的工程师可能也在焦头烂额地催云厂商的客户经理:“哥,我们的GPU配额什么时候能扩容?”
压力是层层传导的:芯片供应紧张 → 云厂商采购成本高、建设周期长 → AI公司租用的算力价格涨、还不稳定 → 最终用户感受到的就是:贵、卡、慢。
信号已经非常明确。今年3月以来,国内外云厂商纷纷调高AI算力服务价格,结束了持续二十年的“云服务只降不升”的神话。这不是云厂商想赚钱想疯了,而是它们建数据中心的万亿级投入,需要回血。更头疼的是,英伟达(NVIDIA)的芯片一两年就换代,但数据中心的设备折旧要摊五六年。微软CEO萨提亚·纳德拉都吐槽过:“我不想背着一代芯片四五年的折旧。”
保用户,还是保利润?一个残酷的单选题
这下,压力全部来到了Kimi、MiniMax这些AI应用公司身上。
它们正被“两头堵”:一头是用户期待稳定、廉价的服务;另一头是上游算力成本持续上涨,以及自身盈利的巨大压力。以已经上市的MiniMax为例,其财报显示,尽管营收增长,但亏损依然巨大,毛利率刚有起色。云服务一涨价,这点薄利可能瞬间被吃掉。
于是,它们不得不做一个残酷的单选题:是牺牲利润,继续补贴用户,维持市场份额和口碑?还是将成本转嫁给用户,冒着用户流失的风险?
最近传出Kimi(月之暗面)考虑赴港上市的消息。一旦上市,每一分钱的花销和利润都要摆在台面上接受投资者审视。“保用户”还是“保利润”这个问题,将不再是战略选择,而是生死攸关的财报数字。
对于我们普通用户来说,这个选择题的答案,直接决定了我们能否继续用“白菜价”享受智能。Kimi最低199元的套餐,已经和国外Claude Pro等产品价格看齐。如果继续涨价,那个我们曾经以为触手可及的“人人可用AI”的廉价时代,可能真的只是一段短暂的窗口期。
这像极了二十年前的电信行业:3G/4G移动互联网爆发,倒逼运营商天量投资建基站,最终行业利润结构被重塑,流量从“奢侈品”变成“日用品”,但基础服务费再也回不到2G时代。
写在最后:我们该如何看待这轮“算力荒”?
作为一名老IT,我看这轮算力荒,心情复杂。它无疑是一盆冷水,浇醒了“AI万能、成本无限下降”的过度乐观。它揭示了一个硬道理:真正的智能,需要坚实的、昂贵的物理世界基础(算力)来承载。
但这未必全是坏事。它正在倒逼整个产业链升级:逼云厂商下决心做重资产投入,逼AI公司思考更可持续的商业模式,也逼我们在使用AI时更加