你也有过这种体验吧?
把任务扔给 AI Agent ,等了三五分钟,出来的东西说能用吧,总觉得差口气。排版像模板填充,逻辑像 AI 写的,视觉就是那种"一眼 AI"的质感——整齐、平淡、没有灵魂。
然后你开始怀疑:是不是模型不行?是不是该换个更强的?
说实话,这种感觉挺操蛋的。花了时间调 prompt 、等输出,结果拿到的是一坨看起来"没错但就是不好"的东西。删也不是,用也不是。
我前两天碰到的这件事,可能会彻底改变你的想法。
两块钱的模型,做了一份让我想删掉的 PPT
事情是这样的。
前两天在写一份教程的时候,顺手用了 Ring-2.6——一个在 OpenRouter 上免费的开源模型。这玩意由 inclusionAI 出品, 1T 参数,在 Agent 执行和工具调用上专门做了优化。当时看到免费就直接上了,连参数都没调。
先让它生成了一个简单的 H5 工具页面,效果还行。
我一想,既然工具页面能跑,不如测测它的上限?把百灵大模型公众号的一篇文章扔给它,让它做份 PPT 。
出来的东西,怎么说呢——
四个字:能用但丑。不对,说"能用"都是抬举它了。
结构平平的,信息堆在一起,视觉上完全没层次。所有文字都差不多大,所有段落都差不多长。你一眼就知道这是 AI 干的——那种毫无惊喜、毫无设计的"AI 味",像食堂大锅饭,管饱但毫无食欲。
说实话我当时有点想直接删了。费这么大劲调了半天,结果就这?
当时我的判断是:这免费模型,大概率也就这德性了。
但故事到这里还没结束。
同一个模型,同一个素材,换了一个变量,结果全变了
前两天在 GitHub 上翻到了一个东西:guizang-ppt-skill[1],歸藏大佬做的, 9.9k 星。
一个专门为 PPT 生成设计的 Skill 。
Skill 是什么?用最直白的话说——它是给模型的任务说明书。告诉模型这类任务该怎么做、用什么布局、输出什么格式。
没有 Skill ,模型只能靠通用经验去猜;有了 Skill ,它就知道:哦, PPT 应该长这样。
我做了三组对比测试,同一篇素材,同一个 Ring-2.6-1T 模型。
A 组:什么引导都不加,让模型自己发挥。 出来的东西:能看,但就是那种"我知道这是 AI 做的"的感觉。信息堆砌,视觉扁平,完全拿不出手。说白了,做出来你都不好意思往群里发——发了人家一眼就能看出来是 AI 糊弄的。
B 组:先让模型做一份执行计划,定好每页讲什么、怎么布局,再动手。 比 A 组明显好不少——结构清楚了,信息层次也出来了。但视觉风格还是比较普通,还是"模板味"重。比 A 强一档,但离"能打"还差着一口气。这口气,怎么都补不上,急人。
C 组:先规划,再配上 guizang-ppt-skill 执行。 Skill 一介入,模型就知道了该用什么布局风格、怎么处理数据展示、页面节奏怎么把控。
结果出来,我盯着屏幕看了好几秒。
这真的是同一个模型做出来的?
同一篇素材,同一个模型,三组结果摆在一起,差距一眼就能看出来。 A 组是大学生交作业水平, B 组是实习生认真做的水平, C 组是可以直接拿出去展示的水平。
这不是微调,是换了个物种。
模型 × Skill :不是加法,是乘法
先搞清楚两个基本概念。
模型是驱动 Agent 完成任务的 AI 引擎。选什么模型,决定了能力上限——推理深度、工具调用是否稳定、能否处理多模态、复杂任务能不能跑通。
Skill是给模型的任务说明书。它告诉模型这类任务该怎么做、用哪些工具、出什么格式。
两者之间不是加法关系。
打个比方你就懂了——你玩 RPG 游戏,角色属性再高,没有技能书,也只能平 A 。反过来,技能书再好,你是个 1 级小号,也放不出大招。搁这儿琢磨换显卡呢,结果发现驱动没装——整挺好,白折腾。
能力弱的模型配上再好的 Skill ,执行容易跑偏,效果始终上不去。能力强但没有 Skill ,输出最多止步于"能用",很难到"好用"。说白了,裸奔的模型就是个蛮力输出,天花板肉眼可见。
两个因子缺一个,结果都难突破。
而且 Skill 还有一个容易被忽略的收益:它在为模型省力气。
有了清晰的执行路径,模型不用把推理资源花在"想清楚该怎么做"上——你玩黑魂打 Boss ,是上去乱砍效率高,还是先看一遍攻略再打效率高?一个道理。大部分人的模型不是不够聪明,是推理资源被"我该怎么做"吃掉了一大半,真正用来干活儿的脑力没剩多少。这事儿挺亏的,但很多人压根没意识到。
资源全部聚焦在执行本身,输出质量自然更上一层。这波不亏。
guizang-ppt-skill 之所以好用,是因为它内置了两套完整的视觉系统:Editorial Magazine 风格(杂志叙事风,像 Monocle 那种电子油墨美学)和 Swiss Internationalist 风格(网格锁定、高饱和度单色、极致排版对比)。 22 种命名锁定的布局模板,不允许你乱调 hex 色值。
这就像你打游戏拿到了神装——它不但给了你伤害值,还给了你攻击动画。
而 Ring-2.6-1T 的优势在于:它专门为 Agent 场景做了优化。 GPQA Diamond 88.27 , AIME 2026 95.83 , SWE-bench 74%。更重要的是 PinchBench 87.60——这个测的是真实世界任务执行,不是纸上做题。工具调用和多步执行的稳定性好, Skill 设定的执行路径能完整跑下来,不偏方向。
真正决定上限的,是你怎么用
回过头来看,为什么很多人用不好 Hermes Agent ?
两个习惯,特别致命。
第一个:拿到任务就让模型直接开干。 Plan 这一步直接跳过。在简单任务里问题不大——路径短,偏也偏不到哪去。但任务一复杂,做到一半发现方向错了,回头改,比一开始多花两倍时间都是常事。
Ring-2.6-1T 的特点是"先想清楚再动手"。它在 Plan 阶段会把任务拆成一个个可执行的步骤,每一步的边界在哪、输出是什么,写得清清楚楚。而且这个阶段你可以介入——你觉得哪步不合理?调整。漏了什么?补上。比做到一半发现跑偏了再回头,省事儿太多了。
第二个:觉得 Skill 是进阶玩法,等基础玩熟了再说。
这个想法可以反过来。
做 PPT 就加 guizang-ppt-skill[2],做设计型演示就加 impeccable[3]——这玩意 28.6k 星,内置 23 个设计指令和 7 个领域参考文件(字体、色彩、动效、空间、交互、响应式、 UX 文案), 27 条反模式规则。遇到要浏览网页的任务就加 agent-browser[4], 33.4k 星,原生 Rust CLI , Chrome 自动化比 Puppeteer 快一个量级。
这些不是外挂,是告诉模型"该怎么做"的说明书。有了说明书,模型就不用自己瞎猜。
而且 Skill 的安装比你想象的简单得多——直接把 GitHub 链接扔给 Hermes ,让它自己搞定就行。不用手动配环境,不用折腾依赖。
有个细节很多人没注意到:日常工作和工具协作场景下, Ring 用 high 档推理就完全够了。只有数学、综合分析这类高难度任务才需要切到 xhigh 。像 PPT 这种任务, high 档稳稳的。
把推理资源用在刀刃上,不是动不动就拉满。
模型选对了, Skill 才发挥得出来
这里有个反直觉的结论:Skill 本身不创造能力,它释放能力。
Ring-2.6-1T 在 Skill 配合下表现稳定的原因之一,是它用了异步 RL + IcePop 算法——万亿参数级别下做强化学习,策略采样和参数更新解耦, GPU 利用率大幅提升。翻译成人话就是:它在多步执行和工具调用上练得更扎实,对 Skill 文档的理解能力和执行一致性都更好。
你换一个工具调用能力弱的模型,给它加同样的 Skill——该调的工具不调,该走的步骤跳着走,效果直接打对折。
这件事越想越像电脑组装。
模型是你的 CPU 和显卡——底子决定了渲染上限。 Skill 是驱动程序和游戏优化配置——告诉你什么场景该开 DLSS ,什么场景该锁帧。你拿一块 GTX 1050 ,驱动再新也跑不动 4K 光追。你拿一块 RTX 5090 不装驱动,跑出来的画面也是糊的。
模型底座和 Skill 是配合关系,不是独立关系。 一个稳的底座 + 一份清晰的说明书,才是真正能打的组合。
Ring-2.6-1T 已经在 Hugging Face 、 ModelScope 和 Ling Studio 全面上线了——huggingface.co/inclusionAI/Ring-2.6-1T[5], MIT 协议,直接上手。
说到底, AI Agent 这个东西,工具本身已经很成熟了。真正拉开差距的,是你有没有给工具装上正确的"技能书"。
你觉得呢?
Ring-2.6-1T 可在以下平台使用: - 🤗 Hugging Face[6] - 🤖 ModelScope[7] - 🌐 Ling Studio[8]( Chat 体验已开放, API 即将上线)
参考链接
[1] guizang-ppt-skill: https://github.com/op7418/guizang-ppt-skill
[2] guizang-ppt-skill: https://github.com/op7418/guizang-ppt-skill
[3] impeccable: https://github.com/pbakaus/impeccable
[4] agent-browser: https://github.com/vercel-labs/agent-browser
[5] huggingface.co/inclusionAI/Ring-2.6-1T: https://huggingface.co/inclusionAI/Ring-2.6-1T
[6] Hugging Face: https://huggingface.co/inclusionAI/Ring-2.6-1T
[7] ModelScope: https://modelscope.cn/models/inclusionAI/Ring-2.6-1T
[8] Ling Studio: https://ling.tbox.cn/chat